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Avant-propos 



La dynamique des logiciels libres en general et du systeme Gnu/Linux en particulier a 
commence a prendre de l'importance il y a quelques annees, et son succes ne s'est pas dementi 
depuis. Le scepticisme que Ton rencontrait encore parfois a l'encontre de Linux a fortement 
diminue, et on trouve de plus en plus d' applications professionnelles de ce systeme, notam- 
ment dans les domaines industriels et scientifiques, ainsi que pour les services reseau. 

Bien au-dela du « pingouin aux ceufs d'or » dont trop de gens aimeraient profiter, il s'agit en 
realite d'un phenomene technologique particulierement interessant. La conception meme du 
noyau Linux ainsi que celle de tout Fenvironnement qui Faccompagne sont des elements passion- 
nants pour le programmeur. La possibility de consulter les sources du systeme d' exploitation, de 
la bibliotheque C ou de la plupart des applications represente une richesse inestimable non seule- 
ment pour les passionnes qui desirent intervenir sur le noyau, mais egalement pour les deve- 
loppeurs curieux de comprendre les mecanismes intervenant dans les programmes qu'ils utilisent. 

Dans cet ouvrage, j ' aimerais communiquer le plaisir que j'eprouve depuis plusieurs annees a 
travailler quotidiennement avec un systeme Linux. Je me suis trouve professionnellement dans 
divers environnements industriels utilisant essentiellement des systemes Unix classiques. 
Lemploi de PC fonctionnant sous Linux nous a permis de multiplier le nombre de postes de 
travail et d'enrichir nos systemes en creant des stations dediees a des taches precises (filtrage 
et diffusion de donnees, postes de supervision...), tout en conservant une homogeneite dans 
les systemes d' exploitation des machines utilisees. 

Ce livre est consacre a Linux en tant que noyau, mais egalement a la bibliotheque Gnu GlibC, 
qui lui offre toute sa puissance applicative. On considerera que le lecteur est a Faise avec le 
langage C et avec les commandes elementaires d'utilisation du systeme Linux. Dans les 
programmes fournis en exemple, F effort a porte sur la lisibilite du code source plutot que sur 
F elegance du codage. Les ouvrages d' initiation au langage C sont nombreux ; on conseillera 
Findispensable [KERNIGHAN 1994], ainsi que Fexcellent cours [CASSAGNE 1998], disponible 
librement sur Internet. En ce qui concerne Finstallation et Futilisation de Linux, on se tour- 
nera par exemple vers [Welsh 2003]. 

Le premier chapitre presentera rapidement les concepts et les outils necessaires au develop- 
pement sous Linux. Les utilitaires ne seront pas detailles en profondeur, on se reportera aux 
documentations les accompagnant (pages de manuels, fichiers info, etc.). 

Nous aborderons ensuite la programmation proprement dite avec Linux et la GlibC. Nous 
pouvons distinguer cinq parties successives : 

• Les chapitres 2 a 11 sont plus particulierement orientes vers F execution des programmes. 
Nous y verrons les identifications des processus, Faeces a Fenvironnement, le lancement et 
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F arret d'un logiciel. Nous traiterons egalement des signaux, en examinant les extensions 
temps-reel, des entrees-sorties simples et de l'ordonnancement des processus. Nous termi- 
nerons cette partie par une presentation des threads Posix. 

• La deuxieme partie sera consacree a la memoire, tant au niveau des mecanismes d' alloca- 
tion et de liberation que de l'utilisation effective des blocs ou des chaines de caracteres. 
Cette partie recouvrira les chapitres 13 a 17 et se terminera par F etude des traitements 
avances sur les blocs de memoire, comme les expressions regulieres ou le cryptage DES. 

• Nous aurons ensuite une serie de chapitres consacres aux fichiers. Les chapitres 18 et 19 
serviront a caracteriser les descripteurs de fichiers et les flux, puis les chapitres 20 a 22 
decriront les operations sur les repertoires, les attributs des fichiers et les bases de donnees 
disponibles avec la GlibC. 

• Les chapitres 23 a 27 peuvent etre considered comme traitant des donnees elles-memes, 
aussi bien les types specifiques comme les caracteres etendus que les fonctions mathema- 
tiques, les informations fournies par le systeme d' exploitation ou l'internationalisation des 
programmes. 

• Enfin, la derniere partie de ce livre mettra 1' accent sur les communications, tout d'abord 
entre processus residant sur le meme systeme, avec les mecanismes classiques et les IPC 
Systeme V. Nous verrons ensuite une introduction a la programmation reseau et a l'utilisa- 
tion des terminaux pour configurer des liaisons serie. Dans cette partie qui s'etend des 
chapitres 28 a 33, on examinera egalement certains mecanismes d' entree-sortie avances 
permettant des multiplexages de canaux de communication ou des traitements asynchrones. 

On remarquera que j'accorde une importance assez grande a 1' appartenance d'une fonction 
aux normes logicielles courantes. C'est une garantie de portabilite des applications. Le stan- 
dard C Ansi (qu'on devrait d'ailleurs plutot nommer ISO C) est important au niveau de la 
syntaxe d'ecriture des applications. La norme Posix (Posix. 1, et ses extensions Posix. lb 
- temps reel et Posix. lc - threads) a longtemps fait figure de reference dans le domaine Unix, 
accompagnee d'un autre standard : Unix 98. 

Le standard qui s'impose de nos jours est une fusion de Posix et de la norme Unix 98. Elles 
ont evolue ensemble pour donner naissance a SUSv3 (Single Unix Specifications version 3). 
Non seulement ce document decrit des fonctionnalites bien respectees sur les systemes Unix 
en general et Linux en particulier, mais il est en outre disponible gratuitement sur Internet, sur 
le site de l'association Open Group (www.opengroup.org). 

J'aimerais profiter de la nouvelle edition de ce livre pour remercier les personnes qui m'ont 
soutenu lors de sa redaction et de sa mise a jour, a commencer par mon epouse Anne-Sophie, 
et mes enfants Jennifer, Mina et Pierre. De nombreux lecteurs m'ont ecrit pour me communi- 
quer leurs observations et me faire part de leurs remarques, je les en remercie de tout coeur. 
J'ajoute un remerciement particulier a mon ami Michael Kerrisk qui m'a fourni des informa- 
tions et des commentaires tres judicieux. 

Ris-Orangis, janvier 2005, 
Christophe@Blaess.fr 
http://www.blaess.fr/christophe/ 
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1 

Concepts et outils 



Ce chapitre a pour but de presenter les principes generaux de la programmation sous Linux, 
ainsi que les outils disponibles pour realiser des applications. Nous nous concentrerons bien 
entendu sur le developpement en C « pur », mais nous verrons aussi des utilitaires et des 
bibliotheques permettant d'etendre les possibilites de la bibliotheque GlibC. 

Nous ne presenterons pas le detail des commandes permettant de manipuler les outils decrits mais 
plutot leurs roles, pour bien comprendre comment s'organise le processus de developpement. 

Generalites sur le developpement sous Linux 

Dans une machine fonctionnant sous Linux, de nombreuses couches logicielles sont empilees, 
chacune fournissant des services aux autres. II est important de comprendre comment fonc- 
tionne ce modele pour savoir oil une application viendra s'integrer. 

La base du systeme est le noyau, qui est le seul element a porter veritablement le nom 
« Linux ». Le noyau est souvent imagine comme une sorte de logiciel mysterieux fonction- 
nant en arriere-plan pour surveiller les applications des utilisateurs, mais il s'agit avant tout 
d'un ensemble coherent de routines fournissant des services aux applications, en s'assurant 
de conserver l'integrite du systeme. Pour le developpeur, le noyau est surtout une interface 
entre son application, qui peut etre executee par n'importe quel utilisateur, et la machine 
physique dont la manipulation directe doit etre supervisee par un dispositif privilegie. 

Le noyau fournit done des points d' entree, qu'on nomme « appels-systeme », et que le pro- 
grammer invoque comme des sous-routines offrant des services varies. Par exemple l'appel- 
systeme write( ) permet d'ecrire des donnees dans un fichier. Lapplication appelante n'a pas 
besoin de savoir sur quel type de systeme de fichiers (ext3, rei serfs, vfat...) Fecriture se 
fera. L envoi des donnees peut me me avoir lieu de maniere transparente dans un tube de 
communication entre applications ou vers un client distant connecte par reseau. Seul le noyau 
s'occupera de la basse besogne consistant a piloter les controleurs de disque, gerer la memoire 
ou coordonner le fonctionnement des peripheriques comme les cartes reseau. 
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II existe une centaine d'appels-systeme sous Linux. lis effectuent des taches tres variees, 
allant de 1' allocation memoire aux entrees-sorties directes sur un peripherique, en passant par 
la gestion du systeme de fichiers, le lancement d' applications ou la communication reseau. 

L' utilisation des appels-systeme est en principe suffisante pour ecrire n'importe quelle appli- 
cation sous Linux. Toutefois, ce genre de developpement serait particulierement fastidieux, et 
la portabilite du logiciel resultant serait loin d'etre assuree. Les systemes Unix compatibles 
avec la norme SUSv3 offrent normalement un jeu d'appels-systeme commun, assurant ainsi 
une garantie de compatibilite minimale. Neanmoins, cet ensemble commun est loin d'etre 
suffisant des qu'on depasse le stade d'une application triviale. 

II existe done une couche superieure avec des fonctions qui viennent completer les appels- 
systeme, permettant ainsi un developpement plus facile et assurant egalement une meilleure 
portabilite des applications vers les environnements non SUSv3. Cette interface est constitute 
par la bibliotheque C. 

Cette bibliotheque regroupe des fonctionnalites complementaires de celles qui sont assurees 
par le noyau, par exemple toutes les fonctions mathematiques (le noyau n' utilise jamais les 
nombres reels). La bibliotheque C permet aussi d'encapsuler les appels-systeme dans des 
routines de plus haut niveau, qui sont done plus aisement portables d'une machine a l'autre. 
Nous verrons a titre d'exemple dans le chapitre 18 que les descripteurs de fichiers fournis par 
l'interface du noyau restent limites a l'univers Unix, alors que les flux de donnees qui les 
encadrent sont portables sur tout systeme implementant une bibliotheque ISO C, tout en ajou- 
tant d'ailleurs des fonctionnalites importantes. Les routines proposees par la bibliotheque C 
(par exemple mal 1 oc( ) et toutes les fonctions d'allocation memoire) sont aussi un moyen de 
faciliter la tache du programmeur en offrant une interface de haut niveau pour des appels- 
systeme plus ardus, comme sbrk( ). 

II y a eu plusieurs bibliotheques C successivement utilisees sous Linux. Les versions 1 a 4 de 
la libc Linux etaient principalement destinees aux programmes executables utilisant le format 
« a. out ». La version 5 de la libc a represente une etape importante puisque le standard 
executable est devenu le format el f, beaucoup plus performant que le precedent. A partir de 
la version 2.0 du noyau Linux, toutes les distributions ont bascule vers une autre version de 
bibliotheque, la GlibC, issue du projet Gnu. Elle est parfois nommee - abusivement - libc 6. 
Au moment de la redaction de ce texte, la version utilisee de la GlibC est la 2.3.2, mais elle 
est evolue regulierement. Toutefois, les fonctionnalites que nous etudierons ici resteront 
normalement immuables pendant longtemps. 



Pour connaitre votre version de bibliotheque C, executez depuis le shell le fichier /I lb/1 i be. so. 6, le numero 
de noyau est visible avec la commande uname -a. 



La bibliotheque GlibC 2 est tres performante. Elle se conforme de maniere precise aux stan- 
dards actuels comme SUSv3, tout en offrant des extensions personnelles innovantes. Le 
developpeur sous Linux dispose done d'un environnement de qualite, permettant aussi bien 
l'ecriture d' applications portables que l'utilisation d'extensions Gnu performantes. La dispo- 
nibilite du code source de la GlibC 2 rend egalement possible la transposition d'une particu- 
larite Gnu vers un autre systeme en cas de portage du logiciel. 
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Chapitre 1 



En fait la richesse de la bibliotheque GlibC rend plus facile le portage d'une application depuis un autre envi- 
ronnement vers Linux que dans le sens inverse. Le defaut - resultant de cette richesse - est la taille de la 
bibliotheque C. Elle est souvent trop volumineuse pour etre employee dans des environnements restreints et 
des systemes embarques. On lui prefere alors d'autres bibliotheques C (comme DietLibc, ou uClibc), moins 
riches mais sensiblement plus legeres. 



Les fonctions de la bibliotheque GlibC et les appels-systeme representent un ensemble mini- 
mal de fonctionnalites indispensables pour le developpement d' applications. lis sont pourtant 
tres limites en termes d'interface utilisateur. Aussi plusieurs bibliotheques de fonctions ont-elles 
ete creees pour rendre le dialogue avec Futilisateur plus convivial. Ces bibliotheques sortent 
du cadre de ce livre, mais nous en citerons quelques-unes a la fin de ce chapitre. 

Le programmeur retiendra done que nous decrirons ici deux types de fonctions, les appels- 
systeme, implementes par le noyau et offrant un acces de bas niveau aux fonctionnalites 
du systeme, et les routines de bibliotheques, qui peuvent completer les possibilites du noyau, 
mais aussi Fencadrer pour le rendre plus simple et plus portable. L' invocation d'un appel- 
systeme est une operation assez couteuse, car il est necessaire d' assurer une commutation du 
processus en mode noyau avec toutes les manipulations que cela impose sur les registres 
du processeur. L'appel d'une fonction de bibliotheque au contraire est un mecanisme leger, 
equivalent a l'appel d'une sous-routine du programme (sauf bien entendu quand la fonction 
de bibliotheque invoque elle-meme un appel-systeme). 

Pour obtenir plus de precisions sur le fonctionnement du noyau Linux, on pourra se reporter a 
[LOVE 2003] Linux Kernel Development, ou directement aux fichiers source de Linux 

Pour des details sur 1' implementation des systemes Unix, l'ouvrage [Bach 1989] Conception 
du systeme Unix est un grand classique, ainsi que [TANENBAUM 1997] Operating Systems, 
Design and Implementation. 

Outils de developpement 

Le developpement en C sous Linux comme sous la plupart des autres systemes d' exploitation 
met en ceuvre principalement cinq types d'utilitaires : 

• L'editeur de texte, qui est a l'origine de tout le processus de developpement applicatif. II 
nous permet de creer et de modifier les fichiers source. 

• Le compilateur, qui permet de passer d'un fichier source a un fichier objet. Cette transfor- 
mation se fait en realite en plusieurs etapes grace a differents composants (preproces- 
seur C, compilateur, assembleur), mais nous n'avons pas besoin de les distinguer ici. 

• L'editeur de liens, qui assure le regroupement des fichiers objet provenant des differents 
modules et les associe avec les bibliotheques utilisees pour F application. Nous obtenons 
ici un fichier executable. 

• Le debogueur, qui peut alors permettre l'execution pas a pas du code, l'examen des varia- 
bles internes, etc. Pour cela, il a besoin du fichier executable et du code source. 

• Notons egalement l'emploi eventuel d'utilitaires annexes travaillant a partir du code 
source, comme le verificateur Lint, les enjoliveurs de code, les outils de documentation 
automatique, etc. 
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Figure 1.1 
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Deux ecoles de programmeurs coexistent sous Linux (et Unix en general) : ceux qui preferent 
disposer d'un environnement integrant tous les outils de developpement, depuis 1' editeur de 
texte jusqu'au debogueur, et ceux qui utilisent plutot les differents utilitaires de maniere 
separee, configurant manuellement un fichier Makefile pour recompiler leur application sur 
un terminal Xterm, tandis que leur editeur prefere s'execute dans une autre fenetre. Dans cet 
ouvrage, nous considererons la situation d'un developpeur preferant lancer lui-meme ses 
outils en ligne de commande. Tous les environnements de developpement integre permettent 
en effet de lire un fichier Makefile externe ou de configurer les options du compilateur ou de 
l'editeur de liens, comme nous le decrirons, alors que le cheminement inverse n'est pas force- 
ment facile. 

Nous allons decrire certaines options des differents utilitaires servant au developpement 
applicatif, mais de nombreuses precisions supplementaires pourront etre trouvees dans 
[LOUKIDES 1997] Programmer avec les outils Gnu, ou dans la documentation accessible avec 
la commande i nfo. 

Editeurs de texte 

L'editeur de texte est probablement la fenetre de l'ecran que le developpeur regarde le plus. II 
passe la majeure partie de son temps a saisir, relire, modifier son code, et il est essentiel de 
maitriser parfaitement les commandes de base pour le deplacement, les fonctions de copier- 
coller et le basculement rapide entre plusieurs fichiers source. 

Chaque programmeur a generalement son editeur fetiche, dont il connait les possibilites, et 
qu'il essaye au maximum d'adapter a ses preferences. II existe deux champions de l'edition 
de texte sous Unix, Vi d'une part et Emacs de 1' autre. Ces deux logiciels ne sont pas du tout 
equivalents, mais ont chacun leurs partisans et leurs detracteurs. 

Vi et Emacs 

Emacs est theoriquement un editeur de texte, mais des possibilites d'extension par l'interme- 
diaire de scripts Lisp en ont fait une enorme machine capable d'offrir F essentiel des 
commandes dont un developpeur peut rever. 

Vi est beaucoup plus leger, il offre nettement moins de fonctionnalites et de possibilites 
d' extensions que Emacs. Les avantages de Vi sont sa disponibilite sur toutes les plates-formes 
Unix et la possibility de l'utiliser meme sur un systeme tres reduit pour reparer des fichiers de 



Concepts et outils 

Chapitre 1 

configuration. La version utilisee sous Linux est nommee vim (mais un alias permet de le 
lancer en tapant simplement vi sur le clavier). 

Vi et Emacs peuvent fonctionner sur un terminal texte, mais ils sont largement plus simples 
a utiliser dans leur version fenetree XI 1. L'un comme 1' autre necessitent un apprentissage. 
II existe de nombreux ouvrages et didacticiels pour l'utilisation de ces editeurs performants. 



Figure 1.2 

Vi sous XI 1 



q m 


VIM — /src/E Xpert/ Compilation/xpr lexical .1 




File Edit 




Help | 


QBE 


s ® © n a a a a Q Q & t © a. 


J ? ' 


p_identif icateur [1263 ■ 'SO'J 



retun (TK.IDENT); 



switch (symbol© -> type.syrobolej i 

case SYMB_MOT_CLE J 

return (symbole -> nurt_symbole)J 

case SYMB_CONSTRNTE : 

constante = i <p_table_constantes [symbole -> num_symbole]>; 

switch (constante -> type) l 

case < TYPE_CST_ENT I ER> : 

p_valeur_entiere = <int) constante -> valeur; 
return <TK_II)_CONST_ENTIERE) ; 

case < TYPE_CST_REEL > ! 

p_valeur_reelle = constante -> valeur; 
return <TK_ID_CONST_REELLE> ; 
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Emacs sous XI 1 
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Editeurs Gnome ou Kde 

Les deux environnements graphiques les plus en vogue actuellement, Gnome et Kde, propo- 
sent tous deux un editeur de texte parfaitement incorpore dans l'ensemble des applications 
fournies. Malheureusement ces editeurs ne sont pas vraiment tres appropries pour le program- 
meur. 

lis sont bien adaptes pour le dialogue avec le reste de Fenvironnement (ouverture automa- 
tique de documents depuis le gestionnaire de fichiers, acces aux donnees par un glissement 
des icones, etc.). 

En contrepartie, il leur manque les possibilites les plus appreciables pour un developpeur, 
comme le basculement alternatif entre deux fichiers, la creation de macros rapides pour 
repeter des commandes de formatage sur un bloc complet de texte, ou la possibilite de scinder 
la fenetre en deux pour editer une routine tout en jetant un coup d'ceil sur la definition des 
structures en debut de fichier. 

On les utilisera done plutot comme des outils d' appoint mais rarement pour travailler longue- 
ment sur une application. 

Nedit 

Comme il est impossible de citer tous les editeurs disponibles sous Linux, je n'en mention- 
nerai qu'un seul, que je trouve parfaitement adapte aux besoins du developpeur. L' editeur 
Nedit est tres intuitif et ne necessite aucun apprentissage. La lecture de sa documentation 
permet toutefois de decouvrir une puissance surprenante, tant dans la creation de macros que 
dans le lancement de commandes externes (make, spel 1, man...), ou la manipulation de blocs 
de texte entiers. 

Nedit est disponible - sous forme de code source ou precompile - pour la plupart des Unix, 
mais n'est pas toujours installe a l'origine. Lessentiel des distributions Linux l'incluent sur 
leurs CD d' installation. 



Figure 1.4 

Nedit 
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Compilateur, editeur de liens 

Le compilateur C utilise sous Linux est gcc (Gnu Compiler Collection). On peut egalement 
l'invoquer sous le nom cc, comme c'est Fusage sous Unix, ou g++ si on compile du code C++. 
II existe aussi une version nommee egcs. II s'agit en fait d'une implementation amelioree de 
gcc, effectuee par une equipe desireuse d'accelerer le cycle de developpement et de mise en 
circulation du compilateur. 

Le compilateur s'occupe de regrouper les appels aux sous-elements utilises durant la compi- 
lation : 

• Le preprocesseur, nomme cpp, gere toutes les directives //define, #ifdef, //include... 
du code source. 

• Le compilateur C proprement dit, nomme ccl ou cclplus si on compile en utilisant la 
commande g++ (voire cclobj si on utilise le dialecte Objective-C). Le compilateur trans- 
forme le code source pretraite en fichier contenant le code assembleur. II est done possible 
d' examiner en detail le code engendre, voire d'optimiser manuellement certains passages 
cruciaux (bien que ce soit rarement utile). 

• L assembleur as fournit des fichiers objet. 

• L'editeur de liens, nomme Id, assure le regroupement des fichiers objet et des bibliothe- 
ques pour fournir enfin le fichier executable. 

Les differents outils intermediaries invoques par gcc se trouvent dans un repertoire situe dans 
Farborescence en dessous de /usr/1 ib/gcc-1 ib/. On ne s'etonnera done pas de ne pas les 
trouver dans le chemin de recherche PATH habituel du shell. 



On notera que gcc est un outil tres complet, disponible sur de nombreuses plates-formes Unix. II permet la 
compilation croisee, ou le code pour la plate-forme cible est produit sur un environnement de developpement 
generalement plus puissant, meme si les systemes d'exploitation et les processeurs sont differents. 



Le compilateur gcc utilise des conventions sur les suffixes des fichiers pour savoir quel utili- 
taire invoquer lors des differentes phases de compilation. Ces conventions sont les suivantes : 



Suffixe 


Produit par 


Role 


. c 


Programmeur 


Fichier source C, seratransmis a cpp, puis a ccl. 


.cc ou .C 


Programmeur 


Fichier source C++, sera transmis a cpp , puis a cclpl us. 


.m 


Programmeur 


Fichier source Objective C, sera transmis a cpp , puis a cclobj. 


.h 


Programmeur 


Fichier d'en-tete inclus dans les sources concernees. Considere comme du C 
ou du C++ en fonction du compilateur invoque (gcc ou g++). 


. i 


cpp 


Fichier C pretraite par cpp, sera transmis a ccl. 


.ii 


cpp 


Fichier C++ pretraite par cpp, sera transmis a cclpl us. 


. s ou .S 


ccl, cclpl us, cclobj 


Fichier d'assemblage fourni par Fun des compilateurs ccl, va etre transmis 
a I'assembleur as. 


.0 


as 


Fichier objet obtenu apres I'assemblage, pret a etre transmis a l'editeur de 
liens 1 d pour fournir un executable. 


. a 


ar 


Fichier de bibliotheque que l'editeur de liens peut lier avec les fichiers objet 

pour creer I'executable. 
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En general, seules les trois premieres lignes de ce tableau concernent le programmeur, car 
tous les autres fichiers sont transmis automatiquement a l'utilitaire adequat. Dans le cadre de 
ce livre, nous ne nous interesserons qu'aux fichiers C, meme si les fonctions de bibliotheques 
et les appels-systeme etudies peuvent tres bien etre employes en C++. 

La plupart du temps, on invoque simplement gcc en lui fournissant le ou les noms des fichiers 
source, et eventuellement le nom du fichier executable de sortie, et il assure toute la transfor- 
mation necessaire. Si aucun nom de fichier executable n'est indique, gcc en creera un, nomme 
a . out. Ceci est simplement une tradition historique sous Unix, meme si le fichier est en realite 
au format actuel elf. 

L' invocation de gcc se fait done avec les arguments suivants : 

• Les noms des fichiers C a compiler ou les noms des fichiers objet a lier. On peut en effet 
proceder en plusieurs etapes pour compiler les differents modules d'un projet, retardant 
F edition des liens jusqu'au moment ou tous les fichiers objet seront disponibles. 

• Eventuellement des definitions de macros pour le preprocesseur, precedees de 1' option -D. 
Par exemple -D_X0PEN_S0URCE=500 est equivalent a une directive #define _X0PEN_S0URCE 
500 avant Finclusion de tout fichier d'en-tete. 

• Eventuellement le chemin de recherche des fichiers d'en-tete (en plus de /usr/include), 
precede de l'option -I. Ceci est surtout utile lors du developpement sous X-Window, en 
ajoutant par exemple -I/usr/XllR6/incl ude. 

• Eventuellement le chemin de recherche des bibliotheques supplementaires (en plus de /l i b 
et /usr/1 ib), precede de l'option -L. Comme pour l'option precedente on utilise surtout 
ceci pour le developpement sous XI 1, avec par exemple — L/usr/XllR6/l ib/. 

• Le nom d'une bibliotheque supplemental a utiliser lors de 1' edition des liens, precede du 
prefixe -1. II s'agit bien du nom de la bibliotheque, et pas du fichier. Par exemple la 
commande -lm permet d'inclure le fichier 1 ibm. so indispensable pour les fonctions mathe- 
matiques. De meme, -1 crypt permet d'utiliser la bibliotheque libcrypt.so contenant les 
fonctions de chiffrage DES. 

• On peut preciser le nom du fichier executable, precede de l'option -o. 

• Enfin, plusieurs options simples peuvent etre utilisees, dont les plus courantes sont : 



Option 


Argument 


But 


-E 




Arreter la compilation apres le passage du preprocesseur, avant le compilateur. 


-s 




Arreter la compilation apres le passage du compilateur, avant I'assembleur. 


-c 




Arreter la compilation apres I'assemblage, laissant les fichiers objet disponibles. 


-w 


Avertissement 


Valider les avertissements (warnings) decrits en arguments. II en existe une 
multitude, mais l'option la plus couramment utilisee est -Wal 1 , pour activer tous 
les avertissements. 


-pedantic 




Le compilateur fournit des avertissements encore plus rigoureux qu'avec -Wall, 
principalement orientes sur la portability du code. 


-g 




Inclure dans le code executable les informations necessaires pour utiliser le 
debogueur. Cette option est generalement conservee jusqu'au basculement du 
produit en code de distribution. 


-0 




0a3 


Optimiser le code engendre. Le niveau d'optimisation est indique en argument (0 = 
aucune). II est deconseille d'utiliser simultanement I'optimisation et le debogage. 
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Les combinaisons d' options les plus couramment utilisees sont done : 

gec -Wall -pedantic -g fichierl.c -c 
gec -Wall -pedantic -g fichier2.c -c 

qui permettent d'obtenir deux fichiers executables qu'on regroupe ensuite ainsi : 

gec fichierl.o fichier2.o -o resultat 
On peut aussi effectuer directement la compilation et l'edition des liens : 

gec -Wall -pedantic -g fichierl.c fichier2.c -o resultat 

Lorsque le code a atteint la maturite necessaire pour basculer en version de distribution, on 
peut utiliser : 

gec -Wall -DNDEBUG -02 fichierl.c fichier2.c -o resultat 

La constante NDEBUG sert, nous le verrons dans un chapitre ulterieur, a eliminer tous le code de 
deboguage incorpore explicitement dans le fichier source. 

Les options permettant d'ajuster le comportement de gec sont tellement nombreuses que Ton 
pourrait y consacrer un ouvrage complet. D'autant plus que gec permet le developpement 
croise, e'est a dire la compilation sur une machine d'une application destinee a une autre 
plate-forme. Ceci est particulierement precieux pour la mise au point de programmes destines 
a des systemes embarques par exemple, ne disposant pas necessairement des ressources 
necessaires au fonctionnement des outils de developpement. 

La plupart du temps nous ne nous soucierons pas de la ligne de commande utilisee pour 
compiler les applications, car elle se trouve incorporee directement dans le fichier de configu- 
ration du constructeur d'application make que nous verrons plus bas. 

Debogueur, profileur 

Lorsqu'une application a ete compilee avec l'option -g, il est possible de l'executer sous le 
controle d'un debogueur. Loutil utilise sous Linux est nomme gdb (Gnu Debugger). Cet utili- 
taire fonctionne en ligne de commande, avec une interface assez rebarbative. Aussi un frontal 
pour X- Window a ete developpe, nomme xxgdb. Utilisant la bibliotheque graphique Athena 
Widget du MIT, ce n'est pas non plus un modele d'esthetique ni de convivialite. 

Un autre frontal est egalement disponible sous Linux, nomme ddd (Data Display Debugger), 
plus agreable visuellement. 

Le debogage d'une application pas a pas est un processus important lors de la mise au point d'un 
logiciel, mais ce n'est pas la seule utilisation de gdb et de ses frontaux. Lorsqu'un processus 
execute certaines operations interdites (ecriture dans une zone non autorisee, tentative d' utilisa- 
tion d' instruction illegale. . .) le noyau lui envoie un signal pour le tuer. Sous certaines conditions, 
l'arret de processus s'accompagne de la creation d'un fichier core 1 sur le disque, representant 
F image de l'espace memoire du processus au moment de l'arret, y compris le code executable. 



1. Le terme core fait reference au noyau de fer doux se trouvant dans les tores de ferrite utilises comme memoire centrale 
sur les premieres machines de l'informatique modeme. La technologie a largement evolue, mais le vocabulaire traditionnel 
a ete conserve. 
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Figure 1.5 

Utilisation de xxgdb 



xxgdb 1 .1 2 



/home/ccb/Doc/FrogLinux/ExemplesflO/exemple tsearch.c 



f Insertion des chaines dans l^bre binaJre "/ 

for (i = 0; chaines p] != NULL; i ++) 

if (tsearch (chaines p], & racine, compare_char)== NULL){ 
perror ("tsearch"); 
exit (1 >; 

} 

for (i = 0; chaines p] != NULL; i ++) 

if (tfind (chaines p], & rapine, compaire_char)== NULL){ 
fprintf (stderr, "%s perdue ?VT, chaines p]); 
exit(1); 

} 

fprintf (stdout, "Parcours preorder (+ leaf) : Vi "); 
type_parcours = preorder. 



Aiome/ccb/Doc/ProgLinux/Exemples/l 0/exemple tsearch .c :43 :852 :beg :0x8048Gd0 

| run 1 1 cont 1 1 next [ | step 1 1 finish 1 1 break 1 1 tbreak 1 1 delete 1 1 up 1 1 down 1 1 print 1 1 print * 1 1 display 1 1 undisplay | 
| show display 1 1 arcjs 1 1 locals 1 1 stack 1 1 edit 1 1 search 1 1 interrupt ] | file j | show brkpts 1 1 yes 1 1 no 1 1 quit | 

Copyright 1998 Free Software Foundation, Inc. 
I GDB is free software, covered by the GNU General Public License, and you are 
I welcome to change it and/or distribute copies of it under certain conditions. 
I Type "3how copying" to see the conditions. 

I There is absolutely no warranty for GDB. Type "show warranty" for details. 
1 Thi3 GDB was configured as 1386-redhat-linux"... 

I (xxgdb ) break 44 — 

j Breakpoint 1 at 0x8048670: file exemplejsearch.c, line 44. 

II (xxgdb) run 

Breakpoint 1 , main () at exemple_tsearch.c:44 
(xxgdb) next 
(xxgdb) print chaines p] 
$1 =0x804886a "A" 
(xxgdb ) A 



Figure 1.6 

Utilisation de ddd 
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((include <stdio.h> 
ttinclude <ctype.h> 



int 

main (void) 

{ 

int 
char 
int 
int 



#333 x 

Run 



lu; 

caracteres [17]; 
emplacement = 0; 
rang = 0; 



caracteres [16] 



■\0' 



while (Clu = getcharO) != EOF) { 

if ((rang = emplacement % 16) =0) 

fprintf (stdout, "SS08X ", emplacement 
rjxFFFFFFFF); 
. © fprintf (stdout, "SS02X", lu); 

fT if Crang = 7) 

fprintf (stdout, "-"); 

else 

(gdb) next 

36 in fprintf. c 
(gdb) next 

main 0 at exemple_getchar.c:19 
(gdb) I 

Main (J at exemple_getchar.c:1 S 
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Le debogueur gdb est capable d'examiner ce fichier, afin de proceder a l'autopsie du proces- 
sus tue. Cette analyse post-mortem est particulierement precieuse lors de la mise au point 
d'un logiciel pour detecter oil se produit un dysfonctionnement apparemment intempestif. De 
plus gdb est egalement capable de deboguer un processus deja en cours de fonctionnement ! 



Notons que gdb peut servir au debogage « croise » : le debogueur fonctionne sur la station de developpe- 
ment tandis qu'un petit demon nomme gdbserver tourne sur la plate-forme cible (en general un systeme 
restreint) reliee par reseau ou cable serie RS-232 a la station de developpement. On peut ainsi deboguer a 
distance un programme dans son environnement d'execution definitif, meme s'il s'agit d'un systeme embarque. 



Dans l'informatique « de terrain », il arrive parfois de devoir analyser d'urgence les cir- 
constances d' arret d'un programme au moyen de son fichier core. Ce genre d' intervention 
peut avoir lieu a distance, par une connexion reseau, ou par une liaison modem vers la 
machine oil F application etait censee fonctionner de maniere sure. Dans ces situations frene- 
tiques, il est inutile d'essayer de lancer les interfaces graphiques encadrant le debogueur, et il 
est necessaire de savoir utiliser gdb en ligne de commande 1 . De toutes manieres, les frontaux 
comme xxgdb ou ddd ne dissimulent pas le veritable fonctionnement de gdb, et il est important 
de se familiariser avec cet outil. 

On invoque generalement le debogueur gdb en lui fournissant en premier argument le nom du 
fichier executable. Au besoin, on peut fournir ensuite le nom d'un fichier core obtenu avec le 
meme programme. 

Lors de son invocation, gdb affiche un message de presentation, puis passe en attente de 
commande avec un message d'invite (gdb). Pour se documenter en detail sur son fonctionne- 
ment, on tapera « help ». Le debogueur proposera alors une serie de themes que Ton peut 
approfondir. Les commandes les plus courantes sont : 



Commande 


Role 


list 


Afficher le listing du code source. 


run [argument] 


Lancer le programme, qui s'executera jusqu'au prochain point d'arret. 


break <ligne> 


Inserer un point d'arret sur la ligne dont le numero est fourni. 


step 


Avancer d'un pas, en entrant au besoin dans le detail des sous-routines. 


next 


Avancer jusqu'a la prochaine instruction, en executant les sous-routines sans s'arreter. 


cont 


Continuer I'execution du programme jusqu'au prochain point d'arret. 


print <variable> 


Afficher le contenu de la variable indiquee. 


backtrace 


Afficher le contenu de la pile, avec les invocations imbriquees des routines. 


quit 


Quitter le debogueur. 



II existe de tres nombreuses autres commandes, comme attach <PID> qui permet de deboguer 
un programme deja en cours d'execution. Pour tout cela, on se reportera par exemple a la 
documentation en ligne i nf o sur gdb. 



1. Croyez-moi, lorsqu'un service d' exploitation operationnelle vous telephone a 22h30 car ils n'arrivent pas a relancer 
l'application apres un redemarrage du systeme, on ne perd pas de temps a lancer les applications XI 1 au travers d'une 
liaison ppp par modem, et on utilise uniquement des outils en ligne de commande ! 
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Voici un exemple de session de deboguage sur un exemple tres simple du chapitre 3. 

$ gdb exemple_argv 

GNU gdb 4.18 

Copyright 1998 Free Software Foundation, Inc. 
GDB is free software, covered by the GNU General Public License, 
[...] 

This GDB was configured as "i386-redhat-l inux" . . . 
Nous commencons par demander un apercu du listing du programme : 
(gdb) list 



1 

2 #include <stdio.h> 

3 

4 

5 int 

6 mainO'nt argc, char * argv[]) 

7 { 

8 int i ; 
9 

10 fprintf (stdout, "%s a recu en argument :\n", argv[0]); 
(gdb) 

11 for (i =1; i < argc; i ++) 

12 fprintf (stdout, " %s\n", argv[i]); 

13 return 0; 

14 } 
(gdb) 



Nous placons un premier point d' arret sur la ligne 12 : 
(gdb) break 12 

Breakpoint 1 at 0x8048420: file exemple_argv.c, line 12. 

Nous indiquons les arguments en ligne de commande, puis nous demarrons le programme : 

(gdb) set args un deux trois 
(gdb) run 

Starting program: /home/ccb/Progl_inux/03/exemple_argv un deux trois 
/home/ccb/Doc/ProgLinux/Exemples/03/exemple_argv a regu en argument : 
Breakpoint 1, main (argc=4, argv=0xbfff fce4) at exemple_argv.c:12 
12 fprintf (stdout, " %s\n", argv[i]); 

Le programme s'etant arrete, nous pouvons examiner ses variables : 

(gdb) print i 
$1 = 1 

(gdb) print argv[i] 

$2 = 0xbffffel9 "un" 

Nous supprimons le point d' arret actuel, et en placons un nouveau sur la ligne suivante, avant 
de demander au programme de continuer son execution : 

(gdb) delete 1 
(gdb) break 13 

Breakpoint 2 at 0x8048450: file exemple_argv.c, line 13. 
(gdb) cont 
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Continuing, 
un 

deux 
trois 

Breakpoint 2, main(argc=4, argv=0xbffffce4) at exemple_argv.c:13 
13 return 0; 

Le programme est arrive sur le nouveau point d' arret, nous pouvons le continuer en pas a pas : 

(gdb) next 



Nous quittons a present gdb : 
(gdb) quit 

II existe un autre outil important dans la phase de mise au point : le profileur. Cet utilitaire 
observe le deroulement de 1' application, et enregistre dans un fichier les temps de presence 
dans chaque routine du programme. II est alors facile d' analyser les goulets d'etranglement 
dans lesquels le logiciel passe le plus clair de son temps. Ceci permet de cibler efficacement 
les portions de l'application qui auront besoin d'etre optimisees. Bien entendu ceci ne 
concerne pas tous les logiciels, loin de la, puisque la plupart des applications passent l'essen- 
tiel de leur temps a attendre les ordres de l'utilisateur. Toutefois il convient que chaque 
operation effectuee par le programme se deroule dans des delais raisonnables, et une simple 
modification d'algorithme, ou de structure de donnees, peut parfois permettre de reduire 
considerablement le temps d'attente de l'utilisateur. Ceci a pour effet de rendre l'ensemble de 
l'application plus dynamique a ses yeux et ameliore la perception qualitative de l'ensemble 
du logiciel. 

L' outil de profilage Gnu s'appelle gprof. II fonctionne en analysant le fichier gtnon .out qui est 
cree automatiquement lors du deroulement du processus, s'il a ete compile avec 1' option -pg 
de gcc. Les informations fournies par gprof sont variees, mais permettent de decouvrir les 
points ou le programme passe l'essentiel de son temps. 

On compile done le programme a profiler ainsi : 

$ cc -Wall -pg programme. c -o programme 
On l'execute alors normalement : 

$ ./programme 

Un fichier gmon .out est alors cree, que Ton examine a l'aide de la commande gprof : 

$ gprof programme gmon. out | less 

L'utilitaire gprof etant assez bavard, il est conseille de rediriger sa sortie standard vers un 
programme de pagination comme more ou less. Les resultats et les statistiques obtenus sont 
expliques en clair dans le texte affiche par gprof. 

Un autre outil de suivi du programme s'appelle strace. II s'agit d'un logiciel permettant de 
detecter tous les appels-systeme invoques par un processus. II observe Pinterface entre le 



14 } 
(gdb) 

Program exited normally. 
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processus et le noyau, et memorise tous les appels, avec leurs arguments. On l'utilise simple- 
ment en l'invoquant avec le nom du programme a lancer en argument. 

$ strace ./programme 

Les resultats sont presentes sur la sortie d'erreur, (que Ton peut rediriger dans un fichier). Une 
multitude d'appels-systeme insoupconnes apparaissent alors, principalement en ce qui concerne 
les allocations memoire du processus. 

Dans la serie des utilitaires permettant d' analyser le code executable ou les fichiers objets, il 
faut egalement mentionner nm qui permet de lister le contenu d'un fichier objet, avec ses diffe- 
rents symboles prives ou externes, les routines, les variables, etc. Pour cela il faut bien 
entendu que la table des symboles du fichier objet soit disponible. Cette table n'etant plus 
utile lorsqu'un executable est sorti de la phase de deboguage, on peut la supprimer en utilisant 
strip. Cet utilitaire permet de diminuer la taille du fichier executable (attention a ne pas 
1' employer sur une bibliotheque partagee !). 

Enfin, citons objdump qui permet de recuperer beaucoup d' informations en provenance d'un 
fichier objet, comme son desassemblage, le contenu des variables initialisees, etc. 

Traitement du code source 

II existe toute une classe d'outils d'aide au developpement qui permettent des interventions 
sur le fichier source. Ces utilitaires sont aussi varies que Fanalyseur de code, les outils de 
mise en forme ou de statistiques, sans oublier les applications de manipulation de fichiers de 
texte, qui peuvent parfaitement s'appliquer a des fichiers sources. 

Verificateur de code 

L'outil Lint est un grand classique de la programmation sous Unix, et son implementation 
sous Linux se nomme 1 cl int. Le but de cet utilitaire est d' analyser un code source C qui se 
compile correctement, pour rechercher d'eventuelles erreurs semantiques dans le programme. 
Lappel de lclint peut done etre vu comme une sorte d' extension aux options -Wall et 
-pedanti c de gcc. 

Linvocation se fait tout simplement en appelant lclint suivi du nom du fichier source. On 
peut bien sur ajouter des options, permettant de configurer la tolerance de 1 cl i nt vis-a-vis des 
constructions sujettes a caution. II y a environ 500 options differentes, decrites dans la page 
d'aide accessible avec « 1 cl int -help flags all ». 

Linvocation de 1 cl int avec ses options par defaut peut parfois etre deprimante. Je ne crois 
pas qu'il y ait un seul exemple de ce livre qui soit accepte tel quel par lclint sans declencher 
au moins une page d'avertissements. Dans la plupart des cas le probleme provient d'ailleurs 
des bibliotheques systeme, et il est necessaire de relacher la contrainte avec des options ajou- 
tees en ligne de commande. On peut aussi inserer des commentaires speciaux dans le corps du 
programme (du type /*@nul 10*/) qui indiqueront a 1 cl i nt que la construction en question est 
volontaire, et qu'elle ne doit pas declencher d'avertissement. 

Cet outil est done tres utile pour rechercher tous les points litigieux d'une application. J'ai 
plutot tendance a F employer en fin de developpement, pour verifier un code source avant le 
passage en phase de test, plutot que de l'utiliser quotidiennement durant la programmation. 
Je considere la session de verification a l'aide de lclint comme une etape a part entiere, a 



Concepts et outils | 
Chapitre 1 I 

laquelle il faut consacrer du temps, du courage et de la patience, afin d'eliminer des que 
possible les bogues eventuels. 

Mise en forme 

II existe un outil Unix nomme i ndent, dont une version Gnu est disponible sous Linux. Cet 
utilitaire est un enjoliveur de code. Ceci signifie qu'il est capable de prendre un fichier source 
C, et de le remettre en forme automatiquement en fonction de certaines conventions precisees 
par des options. 

On F utilise souvent pour des projets developpes en commun par plusieurs equipes de 
programmeurs. Avant de valider les modifications apportees a un fichier, et l'inserer dans 
Farborescence des sources mattresses - par exemple avec cvs decrit plus bas - on invoque 
indent pour le formater suivant les conventions adoptees par l'ensemble des developpeurs. 
De meme lorsqu'un programmeur extrait un fichier pour le modifier, il peut appeler indent 
avec les options qui correspondent a ses preferences. 

La documentation de indent, decrit une soixantaine d'options differentes, mais trois d'entre- 
elles sont principalement utiles, -gnu qui convertit le fichier aux normes de codage Gnu, -kr 
qui correspond a la presentation utilisee par Kernighan et Ritchie dans leur ouvrage [KERNI- 
GHAN 1994]. II existe aussi -orig pour avoir le comportement de l'utilitaire indent original, 
c'est a dire le style Berkeley. Le programme suivant va etre converti dans ces trois formats : 

hello. c : 

#include <stdio.h> 

int main (int argc, char * argv []) 

{ 

int i ; 

fprintf (stdout, "Hello world ! "); 
if (argc > 1) 

{ 

fprintf (stdout, ": "); 
/* Parcours et affichage des arguments */ 
for (i = 1; i < argc; i ++) fprintf (stdout, "%s ", argv [i]); 

} 

fprintf (stdout, "\n"); 
return (0); 

} 

Nous demandons une mise en forme dans le style Gnu : 

$ indent -gnu hello. c -o hello. 2. c 
$ cat hello. 2. c 
#include <stdio.h> 

int 

main (int argc, char *argv[]) 

{ 

int i ; 

fprintf (stdout. "Hello world ! "); 
if (argc > 1) 
{ 
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fprintf (stdout, ": "); 
/* Parcours et affichage des arguments */ 
for (i = 1; i < argc; i++) 
fprintf (stdout, "%s ", argv[i]); 

} 

fprintf (stdout, "\n"); 
return (0); 

} 
$ 

Voyons la conversion en style Kemighan et Ritchie : 

$ indent -kr hello. c -o hello. 3. c 
$ cat hello. 3. c 
#include <stdio.h> 

int maintint argc, char *argv[]) 
{ 

int i ; 

fprintf (stdout, "Hello world ! "); 
if (argc > 1) { 

fprintf (stdout, ": "); 

/* Parcours et affichage des arguments */ 

for (i = 1; i < argc; i++) 

fprintf (stdout, "%s ", argv[i]); 

} 

fprintf (stdout, "\n"); 
return (0); 

} 
$ 

Et finalement le style Berkeley original : 

$ indent -orig hello. c -o hello. 4. c 
$ cat hello. 4. c 
#include <stdio.h> 

int 

maintint argc, char *argv[]) 
{ 

int i ; 

fprintf (stdout, "Hello world ! "); 

if (argc > 1) { 

fprintf (stdout, ": "); 

/* 

* Parcours et affichage des arguments 
*/ 

for (i = 1; i < argc; i++) 

fprintf (stdout, "%s ", argv[i]); 

} 

fprintf (stdout, "\n"); 
return (0); 

} 
$ 
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Chaque programmeur peut ainsi utiliser ses propres habitudes de mise en forme, independam- 
ment des autres membres de son equipe. 

Utilitaires divers 

L'outil grep est essentiel pour un programmeur, car il permet de rechercher une chaine de 
caracteres dans un ensemble de fichiers. II est frequent d' avoir a retrouver le fichier ou une 
routine est definie, ou Femplacement de la declaration d'une structure par exemple. De meme 
on a souvent besoin de rechercher a quel endroit un programme affiche un message d'erreur 
avant de s'arreter. Pour toutes ces utilisations grep est parfaitement adapte. Sa page de manuel 
documente ces nombreuses fonctionnalites, et l'emploi des expressions regulieres pour preciser 
le motif a rechercher. 

Lorsque Ton desire retrouver une chaine de caracteres dans toute une arborescence, il faut le 
coupler a Futilitaire find, en employant la commande xargs pour les relier. Voici a titre 
d'exemple la recherche d'une constante symbolique (ICMPV6_ECH0_REQUEST en l'occurrence) 
dans tous les fichiers source du noyau Linux : 

$ cd /usr/src/1 inux 

$ find . -type f | xargs grep ICMPV6_ECH0_REQUEST 

./net/ipv6/icmp.c: else if (type >= ICMPV6_ECH0_REQUEST && 

./net/ipv6/icmp.c: (&icmpv6_stati sties. I cmp6InEchos ) [type- ICMPV6_ECH0_REQUEST]++; 
./net/ipv6/icmp.c: case ICMPV6_ECH0_REQUEST: 

./1nclude/linux/icmpv6.h:#define ICMPV6_ECH0_REQUEST 128 
$ 

La commande find recherche tous les fichiers reguliers (-type f) de maniere recursive a 
partir du repertoire en cours (.), et envoie les resultats a xargs. Cet utilitaire les regroupe en 
une liste d'arguments qu'il transmet a grep pour y rechercher la chaine demandee. 

Limportance de grep pour un developpeur est telle que les editeurs de texte contiennent 
souvent un appel direct a cet utilitaire depuis une option de menu. 

Lorsqu'on developpe un projet sur plusieurs machines simultanement, on est souvent amene 
a verifier si un fichier a ete modifie et, si e'est le cas, dans quelle mesure. Ceci peut etre 
obtenu a l'aide de Futilitaire diff. II compare intelligemment deux fichiers et indique les 
portions modifiees entre les deux. Cet instrument est tres utile lorsqu'on reprend un projet 
apres quelque temps et qu'on ne se rappelle plus quelle version est la bonne. 

Par exemple, nous pouvons comparer les programmes hello. 3. c (version Kernighan et Ritchie) 
et hello.4.c (version Berkeley) pour trouver leurs differences : 

$ diff hello. 3. c hello. 4. c 

3c3,4 

< int mainO'nt argc, char *argv[]) 

> int 

> mainO'nt argc, char *argv[]) 
5c6 

< int i ; 



> int 
9cl0,12 
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< 



/* Parcours et affichage des arguments */ 



> 



/* 



> 
$ 



> 



* Parcours et affichage des arguments 
*/ 



Ici, diff nous indique une difference a la ligne 3 du premier fichier, qui se transforme en 
lignes 3 et 4 du second, puis une seconde variation a la ligne 5 de l'un et 6 de 1' autre, ainsi 
qu'une derniere difference a la ligne 9, qui se transforme en 10, 1 1 et 12 de Fautre. On le voit, 
la comparaison est intelligente, diff essayant de se resynchroniser le plus vite possible 
lorsqu'il rencontre une difference. Toutefois, lorsque Fenvergure d'une application augmente 
et que le nombre de developpeurs s'accroit, il est preferable d' employer un systeme de controle 
de version comme cvs. 

L'outil diff est aussi tres utilise dans le monde du logiciel libre et de Linux en particulier, 
pour creer des fichiers de differences qu'on transmet ensuite a Putilitaire patch. Ces fichiers 
sont beaucoup moins volumineux que les fichiers source complets. 

Ainsi, alors que les sources completes du noyau Linux representent une archive compressee 
d'environ 36 Mo (noyaux 2.6.x), les fichiers de differences publies par Linus Torvalds tous 
les trois ou quatre jours mesurent en general entre 200 et 500 Ko. Pour creer un tel fichier, on 
utilise l'option -u de diff, suivie du nom du fichier original, puis de celui du fichier modifie. 
On redirige la sortie standard vers un fichier. Ce fichier peut etre transmis a d'autres deve- 
loppeurs qui F appliqueront sur Pentree standard de patch. Ce dernier realisera alors les modi- 
fications sur le fichier original dont une copie est presente. Tout ceci est decrit dans les pages 
de manuel de ces utilitaires. 



Des qu'une application s'appuie sur plusieurs modules independants - plusieurs fichiers 
source C -, il est indispensable d'envisager d'utiliser les mecanismes de compilation separee. 
Ainsi chaque fichier C est compile en fichier objet .o independamment des autres modules 
(grace a l'option -c de gcc), et finalement on regroupe tous les fichiers objet ensemble lors de 
Pedition des liens (assuree egalement par gcc). 

L'avantage de ce systeme reside dans le fait qu'une modification apportee a un fichier source 
ne reclame plus qu'une seule compilation et une edition des liens au lieu de necessiter la 
compilation de tous les modules du projet. Ceci est deja tres appreciable en langage C, mais 
devient reellement indispensable en C++, ou les phases de compilation sont tres longues, 
notamment a cause du volume des fichiers d'en-tete. 

Pour ne pas etre oblige de recompiler un programme source non modifie, on fait appel a 
Putilitaire make. Celui-ci compare les dates de modification des fichiers source et cibles pour 
evaluer les taches a realiser. II est aide en cela par un fichier de configuration nomme Make- 
file (ou makefile, voire GNUmakef i 1 e), qu'on conserve dans le meme repertoire que les 
fichiers source. Ce fichier est constitue par une serie de regies du type : 



Construction d'application 



cible : dependances 
commandes 
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La cible indique le but desire, par exemple le nom du fichier executable. Les dependances 
mentionnent tous les fichiers dont la regie a besoin pour s'executer, et les commandes preci- 
sent comment obtenir la cible a partir des dependances. Par exemple, on peut avoir : 

1 mon_programme : interface. o calcul.o centre. o 

cc -o mon_programme interface. o c calcul.o centre. o 

Lorsque make est appele, il verifie l'heure de modification de la cible et celles des depen- 
dances, et peut ainsi decider de refaire F edition des liens. Si un fichier de dependance est 
absent, ma ke recherchera une regie pour le creer, par exemple 

interface. o : interface. c interface. h commun.h 
cc -Wall -pedantic -c interface. c 

Ce systeme est a premiere vue assez simple, mais la syntaxe meme des fichiers Ma kef i 1 e est 
assez penible, car il suffit d'inserer un espace en debut de ligne de commande, a la place 
d'une tabulation, pour que make refuse le fichier. Par ailleurs, il existe un certain nombre 
de regies implicites que ma ke connait, par exemple comment obtenir un fichier . o a partir 
d'un .c. Pour obtenir des details sur les fichiers Makefile, on consultera done la documen- 
tation Gnu. 

Comme la creation d'un Makefile peut etre laborieuse, on emploie parfois des utilitaires 
supplementaires, imake ou xmkmf, qui utilisent un fichier Imakefile pour creer le ou les 
fichiers Makef i 1 e de l'arborescence des sources. La syntaxe des fichiers Imakef i 1 e est decrite 
dans la page de manuel de imake. 

Une autre possibilite pour creer automatiquement les fichiers Makefile adaptes lors d'un 
portage de logiciel est d'utiliser les outils Gnu automake et autoconf (voir a ce sujet la docu- 
mentation info automake). 



Distribution du logiciel 

La distribution d'un logiciel sous Linux peut se faire de plusieurs manieres. Tout depend 
d'abord du contenu a diffuser. S'il s'agit d'un logiciel libre, le plus important est de fournir 
les sources du programme ainsi que la documentation dans un format le plus portable possible 
sur d'autres Unix. Le point le plus important ici sera de laisser l'entiere liberte au destinataire 
pour choisir l'endroit oil il placera les fichiers sur son systeme, 1' emplacement des donnees de 
configuration, etc. On pourra consulter le document Linux Software-Release-Practice- 
HOWTO, qui contient de nombreux conseils pour la distribution de logiciels libres. 

S'il s'agit de la distribution d'une application commerciale fournie uniquement sous forme 
binaire, le souci majeur sera plutot de simplifier l'installation du produit, quitte a imposer 
certaines restrictions concernant les emplacements de l'application et des fichiers de configu- 
ration. 

Pour simplifier l'installation du logiciel, il est possible de creer un script qui se charge de 
toute la mise en place des fichiers. Toutefois ce script devra etre lance depuis un support 
de distribution (CD ou disquette), ce qui necessite une intervention manuelle de l'adminis- 
trateur pour autoriser 1' execution des programmes sur un support extractible ou une copie du 
script dans le repertoire de l'utilisateur avant le lancement. II est done souvent plus simple de 
fournir une simple archive tar ou un paquetage rpm, et de laisser l'utilisateur les decompacter 
lui-meme. 
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Archive classique 

L'utilitaire tar (Tape Archiver) est employe dans le monde Unix depuis longtemps pour 
regrouper plusieurs fichiers en un seul paquet. A Forigine, cet outil servait surtout a copier le 
contenu d'un repertoire sur une bande de sauvegarde. De nos jours, on l'utilise pour creer une 
archive - un gros fichier - regroupant tout le contenu d'une arborescence de fichiers source. 

Les conventions veulent que la distribution de 1' arborescence des sources d'un projet se fasse 
en incluant son repertoire de depart. Par exemple si une application est developpee dans le 
repertoire ~/src/tnon_appl i / et ses sous-repertoires, il faudra que P archive soit organisee pour 
qu'en la decompactant Putilisateur se trouve avec un repertoire mon_appli/ et ses descen- 
dants. Pour creer une telle archive, on procede ainsi : 

$ cd ~/src 

$ tar -cf mon_appl i .tar mon_appli/ 

Le fichier mon_appl i .tar contient alors toute 1' archive. Pour le decompresser, on peut effec- 
tuer : 

$ cp mon_appl i .tar ~/tmp 
$ cd ~/tmp 

$ tar -xf mon_appl i .tar 
$ Is 

mon_appli .tar 
mon_appl i / 
$ 

La commande c de tar sert a creer une archive, alors que x sert a extraire son contenu. Le f 
precise que F archive est un fichier dont le nom est indique a la suite (et pas F entree ou la 
sortie standard). On peut aussi ajouter la commande z entre c ou x, et f, pour indiquer que 
Farchive doit etre compressee ou decompressee en invoquant gzip., ou «j » pour la 
compresser ou decompresser avec bzip2. 

Lorsqu'on desire fournir un fichier d' installation regroupant un executable, a placer par 
exemple dans /usr/local/bin, et des donnees se trouvant dans /usr/local/lib/..., ainsi 
qu'un fichier d' initialisation globale dans /etc, Femploi de tar est toujours possible mais 
moins commode. Dans ce cas, il faut creer Farchive a partir de la racine du systeme de fichiers 
en indiquant uniquement les fichiers a incorporer. L extraction sur le systeme de Futilisateur 
devra aussi etre realisee a partir de la racine du systeme de fichiers (par root). 

Dans ces conditions, les paquetages rpm representent une bonne alternative. 

Paquetage a la maniere Red Hat 

L'utilitaire rpm (Red Hat Package Manager) n'est pas du tout limite a cette distribution. Les 
paquetages .rpm sont en realite supportes plus ou moins directement par Fessentiel des 
grandes distributions Linux actuelles. 

Le principe de ces paquetages est d'incorporer non seulement les fichiers, mais aussi des 
informations sur les options de compilation, les dependances par rapport a d'autres elements 
du systeme (bibliotheques, utilitaires. . .), ainsi que la documentation des logiciels. Ces paque- 
tages permettent naturellement d'integrer au besoin le code source de F application. 

La creation d'un paquetage necessite un peu plus d'attention que Futilisation de tar, car il 
faut passer par un fichier intermediaire de specifications. Par contre, Futilisation au niveau de 
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F administrates qui installe le produit est tres simple. II a facilement acces a de nombreuses 
possibilites, en voici quelques exemples : 

• Installation ou mise a jour d'un nouveau paquetage : 

rpm -U paquet.rpm 

• Mise a jour uniquement si une ancienne version etait deja installee : 
$ rpm -F paquet.rpm 

• Suppression d'un paquetage : 
$ rpm -e paquet 

• Recherche du paquetage contenant un fichier donne : 
$ rpm -qf /usr/local/bin/fichier 

• Liste de tous les paquets installes et recherche de ceux qui ont un nom donne : 
$ rpm -qa | grep nom 

La page de manuel de rpm est assez complete, et il existe de surcroit un document nomme 
RPM-HOWTO aidant a la creation de paquetages. 

Environnements de developpement integre 

II existe sous Linux plusieurs environnements de developpement integre permettant de gerer 
Fensemble du projet a l'aide d'une seule application. Dans tous les cas, il ne s'agit que de 
frontaux qui sous-traitent les travaux aux outils dont nous avons parle ci-dessus, compilateur, 
editeur de liens, debogueur, etc. 

L'interet d'un tel environnement est avant tout de gerer les dependances entre les modules et 
de faciliter la compilation separee des fichiers. Ceci simplifie le travail par rapport a la redac- 
tion d'un fichier Makef i 1 e comme nous l'avons vu. 

II existe plusieurs environnements. Le plus connu est probablement KDevelop , issu du projet 
KDE. 

Un autre environnement souvent employe est Eclipse, fourni sous licence Open Source. 
Parmi les nombreux environnements commerciaux, Code Warrior de Metrowerks est appa- 
remment l'un des plus repandus. 

Tous ces outils permettent de disposer d'une interface qui aidera des developpeurs provenant 
du monde Windows a s'acclimater a la programmation sous Linux. Tous emploient aussi les 
outils Gnu pour les compilations, debogage, etc. II n'y a done pas de grosses differences de 
performances entre ces environnements, hormis l'ergonomie de 1' interface graphique. 

Controle de version 

II est tout a fait possible de realiser un gros developpement logiciel reunissant de nombreux 
programmeurs sans employer de systeme de controle automatique des versions. Le noyau 
Linux lui-meme en est un bon exemple. Toutefois l'utilisation d'un outil comme RCS (Revi- 
sion Control System) simplifie la mise au point d'une application, principalement lorsque les 
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modifications sont espacees dans le temps et qu'on n'a plus necessairement en memoire la 
liste des corrections apportees en dernier. 

Le systeme RCS est l'equivalent de Futilitaire SCCS (Source Code Control System) qu'on 
trouve sur les Unix commerciaux. Le principe consiste a verrouiller individuellement chaque 
fichier source d'une application. Avant de modifier un fichier, le programmeur devra 
demander son extraction de la base avec la commande co {Check Out) puis, apres F edition, il 
invoquera ci {Check In) pour rendre le fichier au systeme. 

Naturellement RCS garde une trace de chaque modification apportee, avec un descriptif en 
clair. II existe des commandes supplementaires, comme rcsmerge pour imposer une modifica- 
tion sur une ancienne version, rlog pour examiner l'historique d'un fichier, ident pour 
rechercher des chames d' identification, ou rcsdiff qui compare deux versions d'un meme 
fichier. On consultera leurs pages de manuel respectives pour obtenir des informations sur ces 
commandes, en commencant par rcsi ntro. 

En fait, les limitations de RCS apparaissent des que plusieurs developpeurs travaillent sur le 
meme projet. Pour eviter qu'un meme fichier soit modifie simultanement par plusieurs 
personnes, RCS impose qu'une copie seulement puisse etre extraite pour etre modifiee. 
Plusieurs personnes peuvent reclamer une copie en lecture seule du meme fichier, mais on ne 
peut extraire qu'une seule copie en lecture et ecriture. 

Si on desire utiliser RCS durant la phase de developpement d'un logiciel, alors que chaque 
fichier est modifie plusieurs fois par jour, ce systeme necessite une tres forte communication 
au sein de l'equipe de programmeurs (en clair tout le monde doit travailler dans le meme 
bureau). 

Par contre, sa mise en ceuvre est plus raisonnable une fois que le projet commence a atteindre 
son terme, et qu'on passe en phase de tests et de debogage. II est alors utile de conserver une 
trace exacte des modifications apportees, de leurs buts et des circonstances dans lesquelles 
elles ont ete decidees. 

Lorsque le nombre de developpeurs est plus important, il est possible d' employer un autre 
mecanisme de suivi, CVS {Concurrent Version System). Le principe est quelque peu different. 
CVS conserve une copie centralisee de l'arborescence des sources, et chaque developpeur 
peut disposer de sa propre copie locale. Lorsque des modifications ont ete apportees a des 
fichiers source locaux, le programmeur peut alors publier ses changements. CVS assure alors 
une mise a jour des sources mattresses, apres avoir verifie que les fichiers n'ont pas ete modi- 
fies entre-temps par un autre utilisateur. Lorsque des modifications sont publiees, il est 
recommande de diffuser par e-mail un descriptif des changements, ce qui peut etre automatise 
dans la configuration de CVS. 

La resolution des conflits se produisant si plusieurs developpeurs modifient simultanement le 
meme fichier a lieu durant la publication des modifications. Avant la publication, CVS impose 
la mise a jour de la copie locale des sources, en leur appliquant les changements qui ont pu 
avoir lieu sur la copie maitresse depuis la derniere mise a jour. Ces changements sont appli- 
ques intelligemment, a la maniere de diff et de patch. Dans le pire des cas CVS demandera au 
programmeur de valider les modifications si elles se recouvrent avec ses propres corrections. 

Les commandes de CVS sont nombreuses, mais elles se presentent toutes sous forme d' argu- 
ments en ligne de commande pour Futilitaire /usr/bin/cvs. On consultera sa page de manuel 
pour en avoir une description complete. 
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L'efficacite de CVS est surtout appreciable durant la phase de developpement de F application 
et son debogage. Une fois que le logiciel est arrive a une maturite telle qu'il n'est plus main- 
tenu que par une seule personne qui y apporte quelques corrections de temps a autre, il est 
difficile de s'obliger a utiliser systematiquement les commandes de publication des modifica- 
tions et de documentation des changements. Lorsqu'un projet n'est entre les mains que d'un 
seul developpeur, celui-ci a tendance a considerer sa copie locale comme source maitresse du 
systeme. 

On peut imaginer utiliser intensivement CVS durant les phases actives de developpement d'un 
logiciel, puis basculer sur RCS lorsqu'il n'y a plus que des corrections mineures et rares, 
qu'on confie a un nombre restreint de programmeurs. 

Bibliotheques supplementaires pour le developpement 

En fait, la bibliotheque C seule ne permet pas de construire d' application tres evoluee, ou 
alors au prix d'un effort de codage demesure et peu portable. Les limitations de 1' interface 
utilisateur nous empechent de depasser le stade des utilitaires du type « filtre » qu'on 
rencontre sous Unix (tr, grep, wc. . .)■ Pour aller plus loin dans l'ergonomie d'une application, 
il est indispensable de recourir aux services de bibliotheques supplementaires. 

Celles-ci se presentent sous forme de logiciels libres, disponibles sur la majorite des systemes 
Linux. 

Interface utilisateur en mode texte 

La premiere interface disponible pour ameliorer l'ergonomie d'un programme en mode texte 
est la bibliotheque Gnu Readline, conijue pour faciliter la saisie de texte. Lorsqu'un 
programme fait appel aux routines de cette bibliotheque, l'utilisateur peut corriger facilement 
la ligne de saisie, en se deplacant en arriere ou en avant, en modifiant les caracteres deja 
entres, en utilisant meme des possibilites de completion du texte ou d'historique des lignes 
saisies. 

II est possible de configurer les touches associees a chaque action par F intermediate d'un 
fichier d' initialisation, qui peut meme accepter des directives conditionnelles en fonction du 
type de terminal sur lequel l'utilisateur se trouve. La bibliotheque Readline est par exemple 
employee par le shell Bash. 

Pour l'affichage des resultats d'un programme en mode texte, il est conseille d'employer la 
bibliotheque ncurses. II s'agit d'un ensemble de fonctions permettant d'acceder de maniere 
portable aux diverses fonctionnalites qu'on peut attendre d'un ecran de texte, comme le posi- 
tionnement du curseur, Faeces aux couleurs, les manipulations de fenetres, de panneaux, de 
menus . . . 

La bibliotheque ncurses disponible sous Linux est libre et compatible avec la bibliotheque 
curses, decrite par les specifications SUSv3, presente sur Fessentiel des Unix commerciaux. 

Non seulement ncurses nous fournit des fonctionnalites gerant tous les types de terminaux de 
maniere transparente, mais en plus la portabilite du programme sur d'autres environnements 
Unix est assuree. On comprendra que de nombreuses applications y fassent appel. 
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Developpement sous X-Window 

La programmation d' applications graphiques sous X- Window peut parfois devenir un veri- 
table defi, en fonction de la portabilite desiree pour le logiciel. 

Le developpement sous X-Window est organise en couches logicielles successives. Au bas de 
l'ensemble se trouve la bibliotheque Xlib. Cette bibliotheque offre les fonctionnalites 
elementaires en termes de dessin (trace de polygones, de cercles, de texte, etc.), de fenetrage 
et de recuperation d'evenements produits par la souris ou le clavier. La notion de fenetrage est 
ici reduite a sa plus simple expression, puisqu'il s'agit uniquement de zones rectangulaires 
sur Fecran, sans materialisation visible (pas de bordure). 

L'appel des fonctions de la Xlib est indispensable des qu'on utilise des primitives graphiques 
de dessin. Par contre, si on veut disposer ne serait-ce que d'un bouton a cliquer, il faut le 
dessiner entierement avec ses contours, son texte, eventuellement la couleur de fond et les 
ombrages. Naturellement, une bibliotheque prend en charge ce travail et offre des composants 
graphiques elementaires (les widgets). 

Les fonctionnalites proposees par la couche nommee Xt ne sont toujours pas suffisantes, car 
celle-ci ne fait que definir des classes generiques d'objets graphiques et n'en offre pas 
d' implementation esthetique. On peut utiliser les objets fournis par defaut avec le systeme X- 
Window dans la bibliotheque Athena Widget, mais ils ne sont vraiment pas tres elegants (voir 
la figure 1.5). 

Pour obtenir une bonne interface graphique, il faut done utiliser une couche supplementaire. 
Le standard le plus employe dans le domaine industriel est la bibliotheque Motif Xm. Assez 
ergonomique et plutot agreable visuellement (voir la figure 1.4), la bibliotheque Motif est 
disponible sur tous les systemes Unix commerciaux. 

Sous Linux, le gros probleme est que la licence pour les implementations commerciales de 
Motif est relativement chere. Heureusement le projet lesstif, dont le developpement continue 
activement, a produit une implementation libre, compatible avec Motif 1.2. Cette bibliotheque 
n'est pas totalement exempte de bogues, mais elle est bien assez stable pour permettre son 
utilisation quotidienne par un developpeur. 

II est done possible d'ecrire sous Linux des logiciels portables, au standard Motif en utili- 
sant lesstif pom le developpement et les distributions libres, quitte a se procurer une imple- 
mentation commerciale pour l'utilisation finale, si on desire vraiment une version stable de 
Motif. 

II manque toutefois sous Linux un outil permettant de mettre facilement en place une inter- 
face graphique (en faisant glisser des boutons, des barres de defilement, etc.). Certains utili- 
taires existent, mais leurs performances sont generalement assez limitees. La creation d'une 
interface graphique complete passe done par une phase un peu rebarbative de mise en place 
manuelle des composants de chaque boite de dialogue. 

Les environnements Kde et Gnome 

Les deux environnements homogenes les plus repandus sous Linux sont Kde (K Desktop 
Environment) et Gnome (Gnu Network Model Environment). Lun comme F autre possedent 
une interface de programmation tres evoluee, rendant plus facile le developpement de logi- 
ciels graphiques. 
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Ces environnements sont parfaitement appropries pour la mise en ceuvre de logiciels - libres 
ou commerciaux - pour Linux. Toutefois la portability vers d'autres Unix est sensiblement 
amoindrie. 

L'environnement Gnome est construit autour de la bibliotheque graphique GTK {Gimp 
Toolkit), initialement developpee, comme son nom l'indique, pour l'utilitaire graphique 
Gimp. La programmation sous Kde repose sur une bibliotheque nommee Qt, disponible 
gratuitement pour des developpements non commerciaux, mais dont la licence est plus 
restrictive que celle de GTK. II existe des documents sur la programmation sous KDE sur 
le Web. Pour le developpement dans l'environnement Gnome, on consultera [Odin 2000] 
Programmation Linux avec GTK+. 

Conclusion 

Ce chapitre nous aura permis de faire le point sur les outils disponibles pour le developpeur 
dans l'environnement Linux/Gnu. 

Pour avoir de plus amples informations sur l'installation et l'utilisation d'une station Linux, 
on consultera par exemple [Welsh 2003] Le systeme Linux. 

On trouvera des conseils sur la programmation sous Unix en general dans [BOURNE 1985] Le 
systeme Unix et dans [RlFFLET 1995] La programmation sous Unix. 

Enfin, les utilitaires du projet Gnu comme emacs, gcc, gdb, make. . . sont traites en detail dans 
[LOUK1DES 1997] Programmer avec les outils Gnu. 
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Nous allons commencer notre etude de la programmation en C sous Linux par plusieurs 
chapitres analysant les divers aspects de l'execution des applications. Ce chapitre introduira 
la notion de processus, ainsi que les differents identifiants qui y sont associes, leurs significa- 
tions et leurs utilisations dans le systeme. 

Dans les chapitres suivants, nous etudierons les interactions qu'un processus peut etablir avec 
son environnement, c'est-a-dire sa propre vision du systeme, configuree par l'utilisateur, puis 
l'execution et la fin des processus, en analysant toutes les methodes permettant de demarrer 
un autre programme, de suivre ou de controler l'utilisation des ressources, de detecter et de 
gerer les erreurs. 

Presentation des processus 

Sous Unix, toute tache qui est en cours d'execution est representee par un processus. Un 
processus est une entite comportant a la fois des donnees et du code. On peut considerer un 
processus comme une unite elementaire en ce qui concerne l'activite sur le systeme. 

On peut imaginer un processus comme un programme en cours d'execution. Cette represen- 
tation est tres imparfaite car une application peut non seulement utiliser plusieurs processus 
concurrents, mais un unique processus peut egalement lancer l'execution d'un nouveau 
programme, en remplacant entierement le code et les donnees du programme precedent. 

A un instant donne, un processus peut, comme nous le verrons plus loin, se trouver dans 
divers etats. Le noyau du systeme d' exploitation est charge de reguler l'execution des 
processus afin de garantir a l'utilisateur un comportement multitache performant. Le noyau 
fournit un mecanisme de regulation des taches qu'on nomme « ordonnancement » (en 
anglais scheduling). Cela assure la repartition equitable de Faeces au microprocesseur par 
les divers processus concurrents. 
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Sur une machine uni-processeur, il n'y a qu'un seul processus qui s'execute effectivement a 
un instant donne. Le noyau assure une commutation reguliere entre tous les processus 
presents sur le systeme pour garantir un fonctionnement multitache. Sur une machine multi- 
processeur, le principe est le meme, a la difference que plusieurs processus - mais rarement 
tous - peuvent s'executer reellement en parallele. 

On peut examiner la liste des processus presents sur le systeme a l'aide de la commande ps, et 
plus particulierement avec ses options ax, qui nous permettent de voir les processus endormis, 
et ceux qui appartiennent aux autres utilisateurs. On voit alors, meme sur un systeme appa- 
remment au repos, une bonne trentaine de processus plus ou moins actifs : 

COMMAND 
init 

(kflushd) 
(kswapd) 
(nfsiod) 
(nfsiod) 
(nfsiod) 
(nfsiod) 
/sbin/kerneld 
sysl ogd 
kl ogd 
crond 
(inetd) 
(lpd) 

(sendmail ) 
gpm -t PS/2 

/sbin/mingetty tty4 
/sbin/mingetty tty5 
/sbin/mingetty tty6 
/usr/bin/gdm-binary -nodaemon 
/usr/bin/gdm-binary -nodaemon 
/usr/XllR6/bin/X :0 -audit 0 
/bin/sh /home/ccb/.xsession 
/usr/bin/ssh-agent /home/ccb/.xsession 
xfwm 

/usr/bin/xfce 7 4 /etc/Xll/xfce/xfwmrc 0 10 XFwm 
in.telnetd: 192.168.1.50 
login -- ccb 
-bash 
ps ax 



La commande ps affiche plusieurs colonnes dont la signification ne nous importe pas pour le 
moment. Retenons simplement que nous voyons en derniere colonne l'intitule complet de la 
commande qui a demarre le processus, et en premiere colonne un numero d' identification 
qu'on nomme PID. 
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Identification par le PID 

Le premier processus du systeme, init, ainsi que quelques autres sont crees directement 
par le noyau au demarrage. La seule maniere, ensuite, de creer un nouveau processus est 
d'appeler l'appel-systeme forkO, qui va dupliquer le processus appelant. Au retour de cet 
appel-systeme, deux processus identiques continueront d'executer le code a la suite de 
fork( ). La difference essentielle entre ces deux processus est un numero d'identification. On 
distingue ainsi le processus original, qu'on nomme traditionnellement le processus pere, et la 
nouvelle copie, le processus fils. 

L'appel-systeme forkO est declare dans <unistd.h>, ainsi : 
pid_t fork(void) ; 

Les deux processus pouvant etre distingues par leur numero d'identification PID (Process 
IDentifier), il est possible d'executer deux codes differents au retour de l'appel-systeme 
fork( ). Par exemple, le processus fils peut demander a etre remplace par le code d'un autre 
programme executable se trouvant sur le disque. C'est exactement ce que fait un shell habi- 
tuellement. 

Pour connaitre son propre identifiant PID, on utilise l'appel-systeme getpidO, qui ne 
prendpas d'argument et renvoie une valeur de type pid_t. II s'agit, bien entendu, du PID 
du processus appelant. Cet appel-systeme, declare dans <unistd.h>, est Fun des rares qui 
n'echouent jamais : 

I pi d_t getpid(void) ; 

Ce numero de PID est celui que nous avons vu affiche en premiere colonne de la commande ps. 
Sous Linux, le type pi d_t est un entier sur 64 bits, mais ce n'est pas le cas pour tous les Unix. 
Pour assurer une bonne portabilite lors de 1'affichage d'un PID, nous utiliserons la conversion 
f\ d de pri ntf ( ), et nous ferons explicitement une conversion de type en 1 ong i nt ainsi : 

fprintf (stdout, "Mon PID est : £ld\n", (long) getpidO); 

La distinction entre processus pere et fils peut se faire directement au retour de l'appel fork( ). 
Celui-ci, en effet, renvoie une valeur de type pid_t, qui vaut zero si on se trouve dans le 
processus fils, est negative en cas d'erreur, et correspond au PID du fils si on se trouve dans 
le processus pere. 

Voici en effet un point important : dans la plupart des applications courantes, la creation d'un 
processus fils a pour but de faire dialoguer deux parties independantes du programme (a 
l'aide de signaux, de tubes, de memoire partagee. . .). Le processus fils peut aisement acceder 
au PID de son pere (note PPID pour Parent PID) grace a l'appel-systeme getppid( ), declare 
dans <unistd. h> : 

pid_t getppid(void) ; 

Cette routine se comporte comme getpidO , mais renvoie le PID du pere du processus appe- 
lant. En revanche, le processus pere ne peut connaitre le numero du nouveau processus cree 
qu'au moment du retour du fork( ). 



En realite, un processus pourrait etablir la liste de ses fils en analysant le ppid de tous les processus en 
cours d'execution, par exemple a l'aide du pseudo-systeme de fichiers /proc, mais il est quand meme beau- 
coup plus simple de memoriser la valeur de retour de f ork( ). 
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On peut examiner la hierarchie des processus en cours sur le systeme avec le champ PPID de 
la commande ps axj : 

$ ps axj 
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On voit que i ni t n'a pas de pere (PPID = 0), mais qu'un grand nombre de processus heritent 
de lui. On peut observer egalement une filiation directe gdm (2309) - .xsession (3109) - xfwm 
(3162) - xfce (3167) - xterm (4301)... 

Lorsqu'un processus est cree par f ork( ), il dispose d'une copie des donnees de son pere, mais 
egalement de l'environnement de celui-ci et d'un certain nombre d'autres elements (table des 
descripteurs de fichiers, etc.). On parle alors d'heritage du pere. 

Notons que, sous Linux, l'appel-systeme fork( ) est tres econome car il utilise une methode 
de « copie sur ecriture ». Cela signifie que toutes les donnees qui doivent etre dupliquees pour 
chaque processus (descripteurs de fichier, memoire allouee...) ne seront pas immediatement 
recopiees. Tant qu'aucun des deux processus n'a modifie des informations dans ces pages 
memoire, il n'y en a qu'un seul exemplaire sur le systeme. Par contre, des que l'un des 
processus realise une ecriture dans la zone concernee, le noyau assure la veritable duplication 
des donnees. Une creation de processus par fork( ) n'a done qu'un cout tres faible en termes 
de ressources systeme. 

En cas d'erreur, forkO renvoie la valeur -1, et la variable globale errno contient le code 
d'erreur, defini dans <errno.h>. Ce code d'erreur peut etre soit ENOMEM, qui indique que le 
noyau n'a plus assez de memoire disponible pour creer un nouveau processus, soit EAGAIN, 
qui signale que le systeme n'a plus de place libre dans sa table des processus, mais qu'il y en 
aura probablement sous peu. Un processus est done autorise a reiterer sa demande de duplica- 
tion lorsqu'il a obtenu un code d'erreur EAGAIN. 

Voici a present un exemple de creation d'un processus fils par l'appel-systeme fork( ). 
exemple_fork.c : 

//include <stdlib.h> 
#include <stdio.h> 
//include <unistd.h> 
//include <errno.h> 
//include <sys/wait.h> 
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i nt 
main (void) 

{ 

pid_t pid_fils; 
do { 

pid_f i 1 s = fork( ) ; 
} while ((pid_fils == -1) && (errno == EAGAIN) ) ; 
if (pid_fils == -1) { 

fprintf (stderr, "fork () impossible, errno=£d\n", errno); 

return 1; 

} 

if (pid_fils == 0) { /* processus fils */ 

fprintftstdout, "Fils : PID=%ld, PPID=%ld\n". 

(long) getpidO, (long) getppidO); 
return 0; 
} else { /* processus pere */ 

fprintftstdout, "Pere : PID=%d , PPID=%d, PID fils=%ld\n", 
(long) getpid( ) , (long) getppidt ) , (long)pid_f i 1 s) ; 
wait(NULL); 
return 0; 




Lors de son execution, ce programme fournit les informations suivantes : 

$ echo $$ 

4284 

$ ./exemple_fork 

Pere : PID=4340, PPID=4284, PID fils=4341 

Fils : PID=4341, PPID=4340 

$ 

La variable speciale $$ du shell correspond a son PID. Ceci nous permet de voir que le PPID 
du processus pere correspond au shell. 

Dans notre exemple, 1' appel-systeme f ork( ) boucle si le noyau n'a plus assez de place dans 
sa table interne pour creer un nouveau processus. Dans ce cas, le systeme est deja probable- 
ment dans une situation assez critique, et il n'est pas utile de gacher des ressources CPU en 
effectuant une boucle hysterique sur fork( ). II serait preferable d'introduire un delai d'attente 
dans notre code pour ne pas reiterer notre demande immediatement, et attendre ainsi pendant 
quelques secondes que le systeme revienne dans un etat plus calme. Nous verrons des moyens 
d'endormir le processus dans le chapitre 9. 

On remarquera que nous avons introduit un appel-systeme wait (NULL) a la fin du code du 
pere. Nous en reparlerons ulterieurement, mais on peut d'ores et deja noter que cela permet 
d'attendre la fin de l'execution du fils. Si nous n'avions pas employe cet appel-systeme, le 
processus pere aurait pu se terminer avant son fils, redonnant la main au shell, qui aurait alors 
affiche son symbole d'invite ($) avant que le fils n'ait imprime ses informations. Voici ce 
qu'on aurait pu observer : 

$ ./exempl e_fork 

Pere : PID=4344, PPID=4284, PID fils=4345 
$ Fils : PID=4345, PPID=4344 
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Identification de I'utilisateur correspondant au processus 

A F oppose des systemes mono-utilisateurs, un systeme Unix est particulierement oriente vers 
1' identification de ses utilisateurs. Toute activite entreprise par un utilisateur est soumise a des 
controles stricts quant aux permissions qui lui sont attributes. Pour cela, chaque processus 
s'execute sous une identite precise. Dans la plupart des cas, il s'agit de l'identite de I'utilisa- 
teur qui a invoque le processus et qui est definie par une valeur numerique : l'UID (User 
IDentifier). Dans certaines situations que nous examinerons plus bas, il est necessaire pour le 
processus de changer d'identite. 



La commande shell id affiche les identifiants et les groupes auxquels appartient I'utilisateur. 

II existe trois identifiants d'utilisateur par processus : l'UID reel, l'UID effectif, et l'UID 
sauve. L'UID reel est celui de I'utilisateur ayant lance le programme. L'UID effectif est celui 
qui correspond aux privileges accordes au processus. L'UID sauve est une copie de l'ancien 
UID effectif lorsque celui-ci est modifie par le processus. 

L'essentiel des ressources sous Unix (donnees, peripheriques. . .) s'exprime sous forme de 
nceuds du systeme de fichiers. Lors d'une tentative d'acces a un fichier, le noyau effectue des 
verifications d'autorisation en prenant en compte l'UID effectif du processus appelant. Gene- 
ralement, cet UID effectif est le meme que l'UID reel (celui de la personne ayant invoque le 
processus). C'est le cas de toutes les applications classiques ne necessitant pas de privilege 
particulier, par exemple les commandes Unix classiques (Is, cp, mv...) qui s'executent sous 
l'identite de leur utilisateur, laissant au noyau le soin de verifier les permissions d'acces. 
Certaines applications peuvent toutefois avoir besoin - souvent ponctuellement - d'autorisa- 
tions speciales, tout en etant invoquees par n'importe quel utilisateur. L exemple le plus 
evident est su, qui permet de changer d'identite, mais on peut en citer beaucoup d'autres, 
comme mount, qui peut autoriser sous Linux tout utilisateur a monter des systemes de fichiers 
provenant d'un CD-Rom ou d'une disquette, par exemple. II y a egalement les applications 
utilisant des couches basses des protocoles reseau comme ping. Dans ce cas, il faut que le 
processus garde son UID reel pour savoir qui agit, mais il dispose d'un UID effectif lui garan- 
tissant une liberte suffisante sur le systeme pour acceder aux ressources desirees. 
Les appels-systeme getuid( ) et geteuid( ) permettent respectivement d'obtenir l'UID reel et 
l'UID effectif du processus appelant. lis sont declares dans <uni std . h> , ainsi : 

uid_t getuid (void) ; 
uid_t geteuid (void) ; 

Le type uid_t correspondant au retour des fonctions getuidO et geteuidO est defini dans 
<sys/types . h>. II s'agit d'un entier non signe. Depuis Linux 2.4, ce type occupe 32 bits ; 
auparavant il tenait sur 16 bits. Nous utiliserons la conversion %u pour pri ntf ( ) pour garantir 
une bonne portability. 

L'UID effectif est different de l'UID reel lorsque le fichier executable dispose d'un attribut 
particulier permettant au processus de changer d'identite au demarrage du programme. 
Considerons par exemple le programme suivant. 

exemple_getuid.c : 

^include <stdio.h> 
#include <unistd.h> 
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int 
main(void) 
{ 

fprintf (stdout, " UID reel = %u, UID effectif = %u\n", 

getuidO, geteuidO); 
return 0; 

} 

Quand on compile ce programme, on obtient un fichier executable, qu'on lance ensuite : 

$ Is -In exemple_getuid* 

rwxr-xr-x 1 500 500 4446 Jun 10 10:56 exemple_getuid 
rw-r--r-- 1 500 500 208 Jun 10 10:56 exempl e_getuid . c 

$ . /exempl e_getuid UID reel = 500, UID effectif = 500 

$ 

Le comportement est pour F instant parfaitement normal. Imaginons maintenant que root 
passe par la, s'attribue le fichier executable et lui ajoute le bit « Set-UID » a Faide de la 
commande chmod. Lorsqu'un utilisateur va maintenant executer exempl ejetuid, le systeme 
va lui fournir l'UID effectif du proprietaire du fichier, a savoir root (qui a toujours l'UID 0 par 
definition) : 

$ su 

Password: 

# chown root. root exempl e_getuid 

# chmod u+s exempl e_getuid 

# Is -In exempl e_getuid* 

rwsr-xr-x 10 0 4446 Jun 10 10:56 exempl e_getuid 

rw-r--r-- 1 500 500 208 Jun 10 10:56 exempl e_getuid.c 

# ./exempl e_getuid 

UID reel = 0, UID effectif = 0 

# exit 

$ . /exempl e_getuid 

UID reel = 500, UID effectif = 0 
$ 

Nous voyons l'attribut Set-UID indique par la lettre « s » dans les autorisations d'acces. 
L'UID reel est conserve a des fins d' identification eventuelle au sein du processus. 

Notre programme ayant l'UID effectif de root en a tous les privileges. Vous pouvez en avoir 
le cceur net en lui faisant, par exemple, creer un nouveau fichier dans le repertoire /etc. Si 
vous n'avez pas les privileges root sur votre systeme, vous pouvez neanmoins effectuer les 
tests en accord avec un autre utilisateur qui copiera votre executable dans son repertoire 
personnel (pour en prendre possession) et lui ajoutera le bit Set-UID. 

II existe plusieurs appels-systeme permettant a un processus de modifier son UID. II ne peut 
toutefois s'agir que de perdre des privileges, eventuellement d'en retrouver des anciens, mais 
jamais d'en gagner. Imaginons un emulateur de terminal serie (un peu comme kermit ou 
mini com). II a besoin d'acceder a un peripherique systeme (le modem), meme en etant lance 
par n'importe quel utilisateur. II dispose done de son bit Set-UID active, tout en appartenant a 
root. Cela lui permet d'ouvrir le fichier special correspondant au peripherique et de gerer la 
liaison. 
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Toutefois, il faut egalement sauvegarder sur disque des informations n'appartenant qu'a 
l'utilisateur ayant lance F application (sa configuration preferee pour F interface, par 
exemple), voire enregistrer dans un fichier un historique complet de la session. Pour ce faire, 
le programme ne doit creer des fichiers que dans des endroits oil l'utilisateur est autorise a le 
faire. Plutot que de verifier toutes les autorisations d'acces, il est plus simple de perdre tempo- 
rairement ses privileges root pour reprendre Fidentite de l'utilisateur original, le temps de 
faire Fenregistrement (les permissions etant alors verifiees par le noyau), et de redevenir 
eventuellement root ensuite. Nous reviendrons a plusieurs reprises sur ce mecanisme. 

Le troisieme type d'UID d'un processus est FUID sauve. II s'agit d'une copie de Fancien 
UID effectif lorsque celui-ci est modifie par Fun des appels decrits ci-dessous. Cette copie est 
effectuee automatiquement par le noyau. Un processus peut toujours demander a changer son 
UID effectif ou son UID reel pour prendre la valeur de FUID sauve. II est egalement possible 
de prendre en UID effectif la valeur de FUID reel, et inversement. 

Un processus avec le bit Set-UID positionne demarre done avec un UID effectif different de 
celui de l'utilisateur qui Fa invoque. Quand il desire effectuer une operation non privilegiee, 
il peut demander a remplacer son UID effectif par FUID reel. Une copie de FUID effectif est 
conservee dans FUID sauve. II pourra done a tout moment demander a remplacer a nouveau 
son UID effectif par son UID sauve. 

Pour cela, il existe - pour des raisons historiques - plusieurs appels-systeme permettant sous 
Linux de modifier son UID : setuidO, seteuidOet setreuidO sont definis par SUSv3 ; 
setresuid( )est specifique a Linux. 

Les trois premiers appels-systeme sont declares dans <uni std . h> , ainsi : 

int setuid (uid_t uid_effectif ) ; 
int seteuid (uid_t uid_effectif ) ; 
int setreuid (uid_t uid_reel, uid_t uid_effectif ) ; 

lis permettent de modifier un ou plusieurs UID du processus appelant, renvoyant 0 s'ils reus- 
sissent, ou -1 en cas d'echec. 

Nous allons voir le comportement d'un programme Set-UID qui abandonne temporairement 
ses privileges pour disposer des permissions de l'utilisateur Fayant invoque, puis qui reprend 
a nouveau ses autorisations originales. Notez bien que, dans cette premiere version, la recupe- 
ration de Fancienne identite ne fonctionne pas si le programme appartient a root. Ceci est 
clairement defini dans F implementation de setuid ( ). Les developpeurs de Linux previennent 
bien qu'en cas de mecontentement, il faut s'en prendre au comite Posix, qui est responsable 
de cette regie. Nous verrons immediatement apres une version utilisant setreui d( ) , qui fonc- 
tionne dans tous les cas de figure. 

exemple_setuid.c : 

#include <stdio.h> 
#include <unistd.h> 
#include <sys/types.h> 



int 
main (void) 
{ 

uid_t uid_reel; 

uid_t uid_eff; 
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uid_reel = getuidt ) ; 
uid_eff = geteuidt ) ; 

fprintf (stdout, " UID-R = %\x, UID-E = Zu\n" , getuidO, geteuidO); 

fprintf (stdout, " setuid(M) = $d\n", uid_reel, setuid(uid_reel )); 

fprintf (stdout, " UID-R = %u, UID-E = i&iAn", getuidO, geteuidO); 

fprintf (stdout, " setuid(M) = %d\r\" , uid_eff, setuid(uid_eff ) ) ; 

fprintf (stdout, " UID-R = %u, UID-E = ^u\n", getuidO, geteuidO); 



return 0; 

} 

L' execution du programme (copie par un autre utilisateur, et avec le bit Set-UID positionne) 
donne : 

$ Is -In exemple_setuid* 

-rwsr-xr-x 1 501 501 4717 Jun 10 15:49 exemple_setuid 
$ ./exemple_setuid 
UID reel = 500, UID effectif = 501 
setuid(500) = 0 

UID reel = 500, UID effectif = 500 
setuid(501) = 0 

UID reel = 500, UID effectif = 501 

$ 

Si on tente la meme operation avec un programme Set-UID root, il ne pourra plus reprendre 
ses privileges, car lorsque setuid( ) est invoque par un utilisateur ayant un UID effectif nul 
(root), il ecrase egalement l'UID sauve pour empecher le retour en arriere. 

Voici maintenant une variante utilisant l'appel-systeme setreuidO. Comme on peut s'en 
douter, il permet de fixer les deux UID en une seule fois. Si Fun des deux UID vaut -1, il n'est 
pas change. Cet appel-systeme a longtemps ete reserve aux Unix BSD, mais il est dorenavant 
defini par SUSv3 et ne devrait pas poser de problemes de portability sur les systemes recents. 

exemple_setreuid.c : 

#include <stdio.h> 
#include <unistd.h> 
#include <sys/types . h> 



int 
main (void) 

{ 

uid_t uid_reel ; 

uid_t uid_eff; 



uid_reel = getuid( ) ; 
uid_eff = geteuid( ) ; 

fprintf(stdout, " UID-R = %u, UID-E = %u\n", getuidO, geteuidO); 
fprintf (stdout, " setreuid(-l, %d) = M\n", uid_reel, 

setreuid(-l, uid_reel)); 
fprintf (stdout, " UID-R = %u, UID-E = %u\r\" , getuidO, geteuidO); 
fprintf (stdout, " setreuid(-l, %d) = ^d\n", uid_eff, 

setreuid(-l, uid_eff)); 
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fprintf(stdout, " UID-R = %u. UID-E = %u\n" . getuidO, geteuidO); 
fprintf(stdout, " setreuid(%d, -1) = £d\n", uid_eff, 

setreuid(uid_eff , -1)); 
fprintf(stdout, " UID-R = %u, UID-E = %u\n" , getuidO, geteuidO); 

return 0; 

} 

En voici l'execution, apres passage en Set-UID root : 

$ Is -In exemple_setre* 

rwsrwsr-x 10 0 4809 Jun 10 16:23 exempl e_setreui d 

rw-rw-r-- 1 500 500 829 Jun 10 16:23 exempl e_setreui d . c 

$ . /exempl e_setreuid 

UID-R = 500, UID-E = 0 
setreuid(-l, 500) = 0 

UID-R = 500, UID-E = 500 
setreuid(-l, 0) = 0 
UID-R = 500, UID-E = 0 
setreuid(0, -1) = 0 
UID-R = 0, UID-E = 0 
$ 

Cette fois-ci, le changement fonctionne parfaitement, meme avec un UID effectif nul. 

Enfin, il est possible - mais c'est une option specifique a Linux - de modifier egalement 
l'UID sauve, principalement pour empecher le retour en arriere comme le fait setuid( ), avec 
l'appel-systeme setresuid( ). En raison de la specificite de cet appel-systeme, il faut definir la 
constante _GNU_S0URCE avant d'inclure le fichier d'en-tete <unistd.h>. 

int setresuid (uid_t uid_reel, uid_t uid_effectif , uid_t uid_sauve); 

int getresuid (uid_t * uid_reel, uid_t * uid_effectif , uid_t * uid_sauve); 

exemple_setresuid.c : 

#define _GNU_S0URCE 

#include <stdio.h> 
#include <unistd.h> 
#include <sys/types.h> 

int 
main (void) 
{ 

uid_t uid_R, uid_E, uid_S; 
getresuid(& uid_R, & uid_E, & uid_S); 

printf("UID-R=^u, UID-E=^u, UID-S=%u\n", uid_R, uid_E,uid_S) ; 
printft" setresuid(-l, %u)=%d\n", 

uid_E, uid_R, setresuid(-l, uid_E, uid_R)); 
getresuid(& uid_R, & uid_E, & uid_S); 

printf("UID-R=^u, UID-E=2u, UID-S=%u\n", uid_R, uid_E,uid_S) ; 
printft" setresuid(-l, -l)=%d\n", 

uid_S, setresuid(-l. uid_S, -1)); 
getresuid(& uid_R, & uid_E, & uid_S); 
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printf ("UID-R=%u, UID-E=^u, UID-S=:£u\n" , uid_R, uid_E,uid_S) ; 
return 0; 

L' execution est interessante si le programme est installe Set-UID root : 
$ Is -In exemple_setresuid 

-rwsr-xr-x 10 0 12404 Nov 14 15:10 exempl e_setresuid 

$ . /exempl e_setresuid 
UID-R=500, UID-E=0, UID-S=0 

setresuid(-l, 500, 0)=0 
UID-R=500, UID-E=500, UID-S=0 

setresuid(-l, 0, -1)=0 
UID-R=500, UID-E=0, UID-S=0 
$ 

Identification du groupe d'utilisateurs du processus 

Chaque utilisateur du systeme appartient a un ou plusieurs groupes. Ces derniers sont definis 
dans le fichier /etc/groups. Un processus fait done egalement partie des groupes de l'utilisa- 
teur qui l'a lance. Comme nous l'avons vu avec les UID, un processus dispose done de 
plusieurs GID (Group IDentifier) reel, effectif, sauve, ainsi que de GID supplementaires si 
Futilisateur qui a lance le processus appartient a plusieurs groupes. 



Attention 

II ne faut pas confondre les groupes d'utilisateurs auxquels un processus appartient, et qui dependent de la 
personne qui lance le processus et eventuellement des attributs Set-GID du fichier executable, avec les 
groupes de processus, qui permettent principalement d'envoyer des signaux a des ensembles de processus. 
Un processus appartient done a deux types de groupes qui n'ont rien a voir les uns avec les autres. 



Le GID reel correspond au groupe principal de Futilisateur ayant lance le programme (celui 
qui est mentionne dans /etc/passwd). 

Le GID effectif peut etre different du GID reel si le fichier executable dispose de l'attribut 
Set-GID (chmod g+s). C'est le GID effectif qui est utilise par le noyau pour verifier les autori- 
sations d'acces aux fichiers. 

La lecture de ces GID se fait symetriquement a celle des UID avec les appels-systeme 
getgidO et getegidO. La modification (sous reserve d' avoir les autorisations necessaires) 
peut se faire a l'aide des appels setgidO, setegidO et setregidO. Les prototypes de ces 
fonctions sont presents dans <uni std . h>, le type gidj etant defini dans <sys/types . h> : 

gid_t getgid(void) ; 

gid_t getegid(void) ; 

int setgi d ( gi d_t egid); 

int setegid(gid_t egid); 

int setregid(gid_t rgid, gid_t egid); 

Les deux premieres fonctions renvoient le GID demande, les deux dernieres renvoient 0 si 
elle reussissent et -1 en cas d'echec. 

Lensemble complet des groupes auxquels appartient un utilisateur est indique dans /etc/ 
groups (en fait, c'est une table inversee puisqu'on y trouve la liste des utilisateurs appartenant 
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a chaque groupe). Un processus peut obtenir cette liste en utilisant l'appel-systeme get- 
groups( ) : 

| int getgroups (int taille, gid_t liste []); 

Celui-ci prend deux arguments, une dimension et une table. Le premier argument indique la 
taille (en nombre d' entrees) de la table foumie en second argument. L'appel-systeme va 
remplir le tableau avec la liste des GID supplementaires du processus. Si le tableau est trop 
petit, getgroups ( ) echoue (renvoie -1 et remplit errno), sauf si la taille est nulle ; auquel cas, 
il renvoie le nombre de groupes supplementaires du processus. La maniere correcte d'utiliser 
getgroups ( ) est done la suivante. 

exemple_getgroups.c : 

#include <stdio.h> 
//include <stdlib.h> 
//include <sys/types.h> 
//include <unistd.h> 
//include <errno.h> 

int 
main (void) 
{ 

int taille; 

gid_t * table_gid = NULL; 

int i ; 

if ((taille = getgroupstO, NULL)) < 0) { 

fprintf (stderr, "Erreur getgroups, errno = M\n", errno); 
return 1; 

} 

if ((table_gid = callocttaille, sizeof (gid_t) ) ) == NULL) { 
fprintf (stderr, "Erreur calloc, errno = %d\n" , errno); 
return 1; 

} 

if (getgroups(taille, table_gid) < 0) { 

fprintf (stderr, "Erreur getgroups, errno = M\n", errno); 
return 1; 

} 

for (i =0; i < taille; 1 ++) 

fprintf (stdout, "%u ", table_gid[i]); 
fprintf (stdout, "\n"); 

free(table_gid) ; 
return 0; 

} 

qui donne : 

$ ./exemple_getgroups 

500 100 
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Le nombre maximal de groupes auxquels un utilisateur peut appartenir est defini dans <asm/ 
pa ram. h> sous le nom NGROUPS. Cette constante symbolique vaut 32 par defaut sous Linux. 

II est possible de fixer sa liste de groupes supplementaires. La fonction setgroupsO n'est 
neanmoins utilisable que par root (ou un processus dont le fichier executable est Set-UID 
root) 1 . Contrairement a getgroupsO, le prototype est inclus dans le fichier <grp.h> de la 
bibliotheque GlibC 2 : 

int setgroups (size_t taille, const gid_t * table); 

II faut definir la constante symbolique _BSD_SOURCE pour avoir acces a cette fonction. 

exemple_setgroups.c : 

#define _BSD_SOURCE 

#include <stdio.h> 
#include <stdlib.h> 
#include <sys/types.h> 
#include <unistd.h> 
#include <errno.h> 
#include <grp.h> 

int 

main (int argc, char * argv []) 

{ 

gid_t * table_gid = NULL; 



for (i = 1; i < argc ; i ++) 

if (sscanf(argv[i], "%u" , & (table_gid[i - 1])) ! = 1) { 
fprintf (stderr, "GID invalide : &s\n", argv[i]); 
return 1; 

} 

if (setgroups(i - 1, table_gid) < 0) { 

fprintf (stderr, "Erreur setgroups, errno = %d\n" , errno); 
return 1; 



i nt 
i nt 



1 ; 

taille; 



if (argc < 2) { 

fprintf(stderr, "Usage %s GID ...\n", argv[0]); 
return 1; 



if ((table_gid = calloc(argc - 1, sizeof(gid_t))) == NULL) { 
fprintf (stderr, "Erreur calloc, errno = %d\n", errno); 
return 1; 



f ree(table_gid) ; 



/* Passons maintenant a la verification des groupes */ 
fprintf (stdout, "Verification : "); 



1 . En realite, depuis Linux 2.2, il suffit que le processus ait la capacite CAP_SETGI D comme nous le verrons en fin de chapitre. 
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/* 

* meme code que la fonction mainO de exemple_getg roups. c 
*/ 

} 

Ce programme ne fonctionne que s'il est Set-UID root : 
$ Is -In exemple_setgroups* 

-rwxrwxr-x 1 500 500 5606 Jun 11 14:10 exempl e_setgroups 

-rw-rw-r-- 1 500 500 1612 Jun 11 14:05 exempl e_setgroups.c 

$ . /exempl e_setgroups 501 502 503 
Erreur setgroups, errno = 1 
$ su 

Password: 

§ chown root. root exempl e_setgroups 
§ chmod +s exempl e_setgroups 
# exit 

$ Is -In exempl e_setgroups* 

-rwsrwsr-x 10 0 5606 Jun 11 14:10 exempl e_setgroups 

-rw-rw-r-- 1 500 500 1612 Jun 11 14:05 exempl e_setgroups . c 

$ . /exempl e_setgroups 501 502 503 
Verification : 501 502 503 
$ 

Pour un processus Set-UID root, le principal interet de la modification de la liste des groupes 
auxquels appartient un processus est de pouvoir ajouter un groupe special (donnant par 
exemple un droit de lecture et d'ecriture sur un fichier special de peripherique) a sa liste, et de 
changer ensuite son UID effectif pour continuer a s'executer sous l'identite de l'utilisateur, 
tout en gardant le droit d'agir sur ledit peripherique. 

Tout comme nous l'avons vu plus haut avec les UID, il existe sous Linux un GID sauve pour 
chaque processus. Cela permet de modifier son GID effectif (en reprenant temporairement 
l'identite reelle), puis de retrouver le GID effectif original (qui etait probablement fourni 
par le bit Set-GID). Pour acceder aux GID sauves, deux appels-systeme, setresgidO et 
getresgidO, sont disponibles lorsque la constante _GNU_S0URCE est definie avant d'inclure 
<unistd. h> : 

int setresgid (gid_t uid_reel, uid_t uid_effectif , uid_t uid_sauve); 

int getresgid (gid_t * uid_reel, * uid_t uid_effectif , * uid_t uid_sauve); 

Le programme exempl e_setresgid.c est une copie de exempl e_setresuid.c dans lequel on a 
change toutes les occurrences de uid en gid. En voici un exemple d'execution apres sa trans- 
formation en programme Set-GID root : 

$ Is -In . /exempl e_setresgid 

-rwxrwsr-x 10 0 12404 Nov 14 15:38 . /exempl e_setresgid 

$ ./exemple_setresgid 

GID-R = 500, GID-E = 0, GID-S = 0 
setresgid (-1, 500, 0) = 0 

GID-R = 500, GID-E = 500, GID-S = 0 
setresgid (-1, 0, -1) = 0 
GID-R = 500, GID-E = 0, GID-S = 0 

$ 
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Identification du groupe de processus 

Les processus sont organises en groupes. Rappelons qu'il ne faut pas confondre les groupes 
de processus avec les groupes d'utilisateurs que nous venons de voir, auxquels appartiennent 
les processus. Les groupes de processus permettent l'envoi global de signaux a un ensemble 
de processus. Ce concept, tout comme 1'identificateur de session que nous venons immedia- 
tement a la suite, sert surtout aux interpreteurs de commandes - les shells - pour implementer 
le controle des jobs. La prise en consideration des groupes de processus dans les applications 
classiques est rare. 

Pour savoir a quel groupe appartient un processus donne, on utilise F appel-systeme getpgid( ), 
declare dans <unistd.h> : 

pid_t getpgid (pid_t pid); 

Celui-ci prend en argument le PID du processus vise et renvoie son numero de groupe, ou -1 
si le processus mentionne n'existe pas. Avec la bibliotheque GlibC, getpgidO n'est defini 
dans <uni std. h> que si la constante symbolique _GNU_SOURCE est declaree avant Finclusion. 

exemple_getpgid.c : 

#define _GNU_SOURCE 
#include <stdio.h> 
#include <unistd.h> 
^include <sys/types.h> 

int 

main (int argc, char * argv[]) 
{ 

int i; 
long int pid; 
long int pgid; 

if (argc == 1) { 

fprintf (stdout, "%d : %d\n", getpidO, getpgid(O)); 
return 0; 

} 

for (1 = 1: 1 < argc; i ++) 

if (sscanf(argv[i], "Sid", & pid) != 1) { 

fprintf (stderr, "PID invalide : &s\n", argv[i]); 
} else { 

pgid = (long) getpgi d ( ( pi d_t ) pid); 
if (pgid == -1) 

fprintf (stderr, "%~\d inexistant\n" , pid); 

else 

fprintf (stderr, "£ld : %d\n", pid, pgid); 

} 

return 0; 

} 

Ce programme permet de consulter les groupes de n'importe quels processus, « 0 » signifiant 
« processus appelant ». 
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$ ps 

PID TTY STAT TIME COMMAND 
4519 pi S 0:00 -bash 
4565 pO S 0:00 -bash 

5017 pi S 0:00 man getpgid 

5018 pi S 0:00 sh -c (cd /usr/man/f r_FR ; /usr/bin/gtbl /usr/man/f r_FR/m 

5019 pi S 0:00 sh -c (cd /usr/man/f r_FR ; /usr/bin/gtbl /usr/man/f r_FR/m 
5022 pi S 0:00 /usr/bin/less -is 

5026 pO R 0:00 ps 

$ ./exemple_getpgid 4519 4565 5017 5018 5019 5022 5026 0 
4519 : 4519 
4565 : 4565 

5017 : 5017 

5018 : 5017 

5019 : 5017 
5022 : 5017 
5026 inexistant 
0 : 5027 

$ 

Un groupe a ete cree au lancement du processus 5017 (man), et il comprend tous les descen- 
dants (mise en forme et affichage de la page). Le processus dont le PID est identique au 
numero de groupe est nomme leader du groupe. Un groupe n'a pas necessairement de leader, 
celui-ci pouvant se terminer alors que ses descendants continuent de s'executer. 

II existe un appel-systeme getpgrp( ) , qui ne prend pas d'argument et renvoie le numero de 
groupe du processus appelant, exactement comme getpgid(O). Attention toutefois, la portabi- 
lite de cet appel-systeme n'est pas assuree, certaines versions d'Unix l'implementant comme 
un synonyme exact de getpgid ( ). 

exemple_getpgrp.c : 

#include <stdio.h> 
^include <unistd.h> 
#include <sys/types.h> 

int 

main (int argc, char * argv[]) 
{ 

fprintf (stdout, "£ld : %ld\n", (long) getpidO, (long) getpgrpO); 
return 0; 

} 

$ ./exemple_getpgrp 

7344 : 7344 
$ 

La plupart des applications n'ont pas a se preoccuper de leur groupe de processus, mais cela 
peut parfois etre indispensable lorsqu'on desire envoyer un signal a tous les descendants d'un 
processus pere. Les interpreters de commandes, ou les programmes qui lancent des appli- 
cations diverses (gestionnaires de fenetres XI 1, gestionnaires de fichiers...), doivent pou- 
voir tuer tous les descendants directs d'un processus fils. Cela peut aussi etre necessaire si 
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F application cree de nombreux processus fils (par exemple a chaque demande de connexion 
pour un demon serveur reseau) et desire pouvoir se terminer completement en une seule fois. 

Un processus peut modifier son propre identifiant de groupe ou celui de Fun de ses descen- 
dants grace a l'appel-systeme setpgid ( ) : 

int setpgid (pid_t pid, pid_t pgid); 

Le premier argument correspond au PID du processus a modifier. Si cet argument est nul, on 
considere qu'il s'agit du processus appelant. Le second argument indique le nouveau numero 
de groupe pour le processus concerne. Si le second argument est egal au premier ou s'il est 
nul, le processus devient leader de son groupe. 

L'appel-systeme echoue si le processus vise n'est ni le processus appelant ni l'un de ses 
descendants. Par ailleurs, un processus ne peut plus modifier le groupe de l'un de ses descen- 
dants si celui-ci a effectue un appel a l'une des fonctions de la famille exec( ). Generalement, 
les interpreters de commandes utilisent la procedure suivante : 

• Le shell execute un fork( ). Le processus pere en garde le resultat dans une variable pid_ 
fils. 

• Le processus fils demande a devenir leader de son groupe en invoquant setpgid(O.O). 

• De maniere redondante, le processus pere reclame que son fils devienne leader de son 
groupe, cela pour eviter tout probleme de concurrence d' execution. Le pere execute done 
setpgid (pid_fils, pi d f i Is). 

• Le pere peut alors attendre, par exemple, la fin de l'execution du fils avec waitpid( ). 

• Le fils appelle une fonction de la famille exec( ) pour lancer la commande desiree. 

Le shell pourra alors controler F ensemble des processus appartenant au groupe du fils en leur 
envoyant des signaux (STOP, CONT, TERM...). Le double appel a setpgidO dans le pere et le 
fils est necessaire car nous devons etre stirs que la modification est realisee avant que le fils 
n'appelle exec( ) (done Finvocation dans le processus pere seul n'est pas suffisante) et avant 
que le pere ne commence a lui envoyer des signaux (symetriquement F appel dans le 
processus fils n'est pas suffisant). 

II existe un appel-systeme setpgrp( ) , qui sert directement a creer un groupe de processus et 
a en devenir leader. II s'agit d'un synonyme de setpgid(0, 0). Attention la encore a la porta- 
bility de cet appel-systeme, car sous BSD il s'agit d'un synonyme de setpgid( ) utilisant done 
deux arguments. 



Identification de session 

II existe finalement un dernier regroupement de processus, les sessions, qui reunissent divers 
groupes de processus. Les sessions sont tres liees a la notion de terminal de controledes 
processus. II n'y a guere que les shells ou les gestionnaires de fenetres pour les environne- 
ments graphiques qui ont besoin de gerer les sessions. Une exception toutefois : les applica- 
tions qui s'executent sous forme de demon doivent accomplir quelques formalites concernant 
leur session. C'est done principalement ce point de vue qui nous importera ici. 

Generalement, une session est attachee a un terminal de controle, celui qui a servi a la 
connexion de Futilisateur. Avec F evolution des systemes, les terminaux de controle sont 
souvent des pseudo-terminaux virtuels geres par les systemes graphiques de fenetrage ou par 
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les pilotes de connexion reseau, comme nous le verrons dans le chapitre 33. Au sein d'une 
session, un groupe de processus est en avant-plan ; il recoit directement les donnees saisies 
sur le clavier du terminal, et peut afHcher ses informations de sortie sur l'ecran de celui-ci. 
Les autres groupes de processus de la session s'executent en arriere-plan. Leur interaction 
avec le terminal sera etudiee ulterieurement dans le chapitre sur les signaux. 

Pour creer une nouvelle session, un processus ne doit pas etre leader de son groupe. En effet, 
la creation de la session passe par une etape de constitution d'un nouveau groupe de proces- 
sus prenant l'identifiant du processus appelant. II est indispensable que cet identifiant ne soit 
pas encore attribue a un groupe qui pourrait contenir eventuellement d' autres processus. 

La creation d'une session s'effectue par l'appel-systeme setsid( ) , declare dans <uni std. h> : 
pid_t setsid (void) ; 

II renvoie le nouvel identifiant de session, de type pid_t. Lors de cet appel, un nouveau 
groupe est cree, il ne contient que le processus appelant (qui en est done le leader). Puis, une 
nouvelle session est creee, ne contenant pour le moment que ce groupe. Cette session ne 
dispose pas de terminal de controle. Elle devra en recuperer un explicitement si elle le desire. 
Les descendants du processus leader se trouveront, bien entendu, dans cette nouvelle session. 

Un point de detail reste a preciser. Pour etre sur que le processus initial n'est pas leader de son 
groupe, on utilise generalement l'astuce suivante : 

• Un processus pere execute un fork( ) , suivi d'un exit( ). 

• Le processus fils se trouvant dans le meme groupe que son pere ne risque pas d'etre leader, 
et peut done tranquillement invoquer setsid ( ). 

La fonction getsid( ) prend en argument un PID et renvoie 1'identifiant de la session, e'est-a- 
dire le PID du processus leader : 

pid_t gets id (pid_t pid); 

Cet appel-systeme n'est declare dans <unistd.h> que si la constante _GNU_SOURCE est definie 
avant son inclusion. Cette fonction n'echoue que si le PID transmis ne correspond a aucun 
processus existant. Comme d'habitude, getsid(O) renvoie 1'identifiant du processus appelant. 
Bien que definie dans SUSv3, cette fonction n'est pas portable sur tous les systemes BSD. 

exemple_getsid.c : 

#define _GNU_SOURCE 
#include <stdio.h> 
^include <unistd.h> 
#include <sys/types.h> 

int 

main (int argc, char * argv[]) 
{ 

int i; 
long int pid; 
long int sid; 

if (argc == 1) { 

fprintf(stdout, "%d : £d\n", getpidO, getsid(O)); 
return 0; 
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Capacites d un processus 

Depuis Linux 2.2, la toute -puissance d'un processus execute sous l'UID effectif root peut etre 
limitee. Une application dispose a present d'un jeu de capacites permettant de definir ce que 
le processus peut faire sur le systeme. Cela est defini dans le document Posix.le (ancienne- 
ment Posix.6). 

Les capacites d'un processus correspondent a des privileges, aussi les applications courantes 
ont-elles des ensembles de capacites vides. En dotant un programme d'un jeu restreint de 
privileges (par exemple pour modifier sa propre priorite d'ordonnancement, on lui accorde 
une puissance sufHsante pour accomplir son travail, tout en evitant tout probleme de securite 
qui pourrait survenir si le programme etait detourne de son utilisation normale. Ainsi, meme 
si une faille de securite existe dans 1' application, et si elle est decouverte par un utilisateur 
malintentionne, celui-ci ne pourra exploiter que le privilege accorde au programme et pas 
d'autres capacites dangereuses reservees habituellement a root (par exemple pour inserer un 
module personnel dans le noyau). 

Un processus dispose de trois ensembles de capacites : 

• L' ensemble des capacites effectives est celui qui est utilise a un instant donne pour verifier 
les autorisations du processus. Cet ensemble joue un role similaire a celui de l'UID 
effectif, qui n'est pas necessairement egal a l'UID reel, mais est utilise pour les permis- 
sions d'acces aux fichiers. 

• L' ensemble des capacites transmissibles est celui qui sera herite lors d'un appel-systeme 
exec( ). Notons que l'appel fork( ) ne modifie pas les ensembles de capacites ; le fils a les 
memes privileges que son pere. 

• L' ensemble des capacites possibles est une reserve de privileges. Un processus peut copier 
une capacite depuis cet ensemble vers n'importe lequel des deux autres. C'est en fait cet 
ensemble qui represente la veritable limite des possibilites d'une application. 

Une application a le droit de realiser les operations suivantes sur ses capacites : 

• On peut mettre dans l'ensemble effectif ou l'ensemble transmissible n'importe quelle 
capacite. 

• On peut supprimer une capacite de n'importe quel ensemble. 

Un fichier executable dispose egalement en theorie des memes trois ensembles. Toutefois, les 
systemes de fichier actuels ne permettent pas encore le support pour toutes ces donnees. Aussi 
un fichier executable Set-UID root est-il automatiquement lance avec ses ensembles de capa- 
cites effectives et possibles remplis. Un fichier executable normal demarre avec des ensem- 
bles effectif et possible egaux a l'ensemble transmissible du processus qui l'a lance. Dans 
tous les cas, l'ensemble transmissible n'est pas modifie durant F appel-systeme exec( ). 

Les capacites presentes dans le noyau Linux sont definies dans <linux/capability.h>. En 
voici une description, les asterisques signalant les capacites mentionnees dans le document 
Posix.le. 

Lorsque nous examinerons une fonction privilegiee, nous indiquerons quelle capacite est 
necessaire pour s'en acquitter. Par contre, nous n'allons pas detailler le moyen de configurer 
les permissions d'un processus, car l'interface du noyau est sujette aux changements. II existe 
depuis Linux 2.2 deux appels-systeme, capsetO et capgetO, permettant de configurer les 
ensembles de permissions d'un processus. Toutefois, ils ne sont ni portables ni meme garantis 
d'exister dans les noyaux futurs. 
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Nom 


Signification 


CAP. 


.CHOWN (*) 


Possibilite de modifier le proprietaire ou le groupe d'un fichier. 


CAP_ 


_DAC_ 


.OVERRIDE (*) 


Acces complet sur tous les fichiers et les repertoires. 


CAP_ 


_DAC_ 


_READ_SEARCH (*) 


Acces en lecture ou execution sur tous les fichiers et repertoires. 


CAP_ 


.FOWNER (*) 


Possibilite d'agir a notre gre sur un fichier ne nous appartenant pas, sauf pour les 
cas ou CAP_FSETID est necessaire. 


CAP_ 


_FSETID (*) 


Possibilite de modifier les bits Set-UID ou Set-GID d'un fichier ne nous appartenant 
pas. 


CAP_ 


.IPC. 


.LOCK 


Autorisation de verrouiller des segments de memoire partagee et de bloquer des 
pages en memoire avec ml ock( ). 


CAP_ 


.IPC. 


.OWNER 


Acces aux communications entre processus sans passer par les autorisations 


CAP_ 


.KILL (*) 


Possibilite d'envoyer un signal a un processus ne nous appartenant pas. 


CAP_ 


.LEASE 


Autorisation d'etablir un « bail » sur un fichier pour etre averti par un signal si un 
autre processus ouvre ce fichier. 


CAP_ 


.MKNOD 


Creation d'un fichier special representant un peripherique. 


CAP_ 


_LINUX_IMMUTABLE 


Modification d'attributs speciaux des fichiers. 


CAP_ 


.NET. 


ADMIN 


Possibilite d'effectuer de nombreuses taches administratives concernant le reseau, 
les interfaces, les tables de routage, etc. 


CAP_ 


.NET. 


_BIND_SERVICE 


Autorisation d'acceder a un port privilegie sur le reseau (numero de port inferieur 
a 1 024). 


CAP_ 


.NET. 


.BROADCAST 


Autorisation d'emettre des donnees en broadcast et de s'inscrire a un groupe 

multipart 


CAP_ 


.NET. 


.RAW 


Possibilite d'utiliser des sockets reseau de type raw. 


CAP_ 


.SETGID (*) 


Autorisation de manipuler le bit Set-GID et de s'ajouter des groupes supplemen- 
taires 


CAP 


.SETPCAP 


PnQQihilitp Hp tranQfprpr nnQ nananitpQ a iin aiitrp nrnppQQiiQ /imnnQQihlp a iitiliQpr^ 

r UOOIUIIIIC UC 11 d.1 lolCI CI 1 IUO UafJcJLjl LCo ct U 1 1 CtU LI C |JI UUCooUo \\ 1 1 IjJUOOlU IC a U LI 1 loci ) . 


CAP 


.SETUID (*) 


Ai itnriQatinn Hp manim ilpr Ipq .Qpt-1 IID pt ^pt-f-iin H'i in fi rhipr nni iq annartpnant 

fiUlUI laCUIVJI 1 UC IIIQI lipUICI ICO Ul la OCI UIU CI UCl UIL/ U Ul 1 llbl IICI 1 IUUO QU|JCll LCI ICll 11. 


CAP_ 


.SYS. 


ADMIN 


Possibilite de realiser de nombreuses operations de configuration concernant le 

QVQtpmp nrnnrpmpnt Hit 

OyOlCIIIC |JI \J^J\ CI 1 ICI IL UIL. 


CAP 


.SYS. 


.BOOT 


Ai itnriQatinn H'arrptpr pt Hp rpHpmarrpr la marhinp 

nUIWI IOCUIUI 1 U al 1 CICI CI Uv ICUCIIIQIICI ICl II ICtUI III IC . 


CAP 


.SYS. 


.CHROOT 


PnQQihilitp H'ntiliQpr l'annpl-Q\/Qtpmp rhrnnt ( 1 

i uooik/iiuc vi u liiioci i ciuuci oy oici lie liii uul \ 


CAP 


.SYS. 


.MODULE 


Ai itnriQatinn H'inQPrpr nil Hp rptirpr Hpq mnHiilpQ Hp rnHp Han*? |p nnvaii 

nUlUI locUIUI 1 U IMOCICI UU UC ICLIICI UCO 1 1 lUUUICo UC l/UUC UQIIO ic nuyau, 


CAP 


.SYS. 


.NICE 


PnQQihilitp Hp mnHifipr Qa nrinritp H'nrHnnnannpmpnt ni i Hp haQm ilpr pn fnnntinnnp- 

r UOOIUIIIIC UC 1 1 IUUI 1 ICI OCt Ul IUI 1 LC u Ul UUI ll ICtl IUCI 1 ICI IL, UU UC UdOUUICI CI 1 IUIIULIUIIIIC 

ment temps-reel. 


CAP_ 


.SYS. 


.PACCT 


Mise en service de la comptabilite des processus. 


CAP_ 


.SYS. 


.PTRACE 


Possibilite de suivre I'execution de n'importe quel processus. 


CAP_ 


.SYS. 


.RAW 10 


Acces aux ports d'entree-sortie de la machine. 


CAP_ 


.SYS. 


.RESOURCE 


Possibilite de modifier plusieurs limitations concernant les ressources du systeme. 


CAP_ 


.SYS. 


.TIME 


Mise a I'heure de I'horloge systeme. 


CAP_ 


.SYS. 


_TTY_CONFIG 


Autorisation de configurer les consoles. 
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Pour agir sur les privileges d'une application, il faut employer la bibliotheque libcap, qui 
n'est pas toujours installee dans les distributions courantes. Cette bibliotheque fournit non 
seulement des fonctions Posix.le pour modifier les permissions, mais egalement des utili- 
taires permettant, par exemple, de lancer une application avec un jeu restreint de privileges. 



Attention 

Ne confondez pas la bibliotheque 1 ibcap qui gere les capacites des processus et la bibliotheque 1 ibpcap 
qui sert a capturer des paquets sur le reseau. 



La segmentation des privileges habituellement reserves a root est une chose importante pour 
l'avenir de Linux. Cela permet non seulement a un administrateur de deleguer certaines 
taches a des utilisateurs de confiance (par exemple en leur fournissant un shell possedant la 
capacite CAP_SYS_B0OT pour pouvoir arreter Fordinateur), mais la securite du systeme est aussi 
augmentee. Une application ayant besoin de quelques privileges bien cibles ne disposera pas 
de la toute-puissance de root. Ainsi, un serveur XI 1 ayant besoin d'acceder a la memoire 
video aura la capacite CAP_SYS_RAWIO, mais ne pourra pas aller ecrire dans n'importe quel 
fichier systeme. De meme, un logiciel d'extraction de pistes audio depuis un CD, comme 
l'application cdda2wav, aura le privilege CAP_SYS_NICE car il lui faudra passer sur un ordon- 
nancement temps-reel, mais il n'aura pas d'autres autorisations particulieres. 

Si un pirate decouvre une faille de securite lui permettant de faire executer le code de son 
choix sous l'UID effectif de l'application - comme nous le verrons dans le chapitre 10 a 
propos de la fonction gets( ) -, il n'aura toutefois que le privilege du processus initial. Dans 
les deux exemples indiques ci-dessus, il pourra perturber l'affichage grace a Faeces a la 
memoire video, ou bloquer le systeme en faisant boucler un processus de haute priorite 
temps-reel. Dans un cas comme dans 1' autre, cela ne presente aucun interet pour lui. II ne 
pourra modifier aucun fichier systeme (pas d'ajout d'utilisateur, par exemple) ni agir sur le 
reseau pour se dissimuler en preparant l'attaque d'un autre systeme. Ses possibilites sont 
largement restreintes. 

Malheureusement, il n'existe pas encore - avec Linux 2.6 - d' interface homogene au niveau 
des systemes de fichiers pour configurer les capacites des processus. Des evolutions dans ce 
sens apparaissent, par exemple le systeme SeLinux (Security Enhanced Linux), mais elles 
sont encore peu repandues. 

Conclusion 

Dans ce chapitre, nous avons essaye de definir la notion de processus, la maniere d'en creer, 
et les differents identifiants qui peuvent y etre attaches. Une application classique n'a pas 
souvent l'occasion de manipuler ses UID, GID, etc. Cela devient indispensable toutefois si 
Faeces a des ressources privilegiees qui doivent etre offertes a tout utilisateur est necessaire. 
L'application doit savoir perdre temporairement ses privileges, quitte a les recuperer ulterieu- 
rement. De meme, certains programmes ayant un dialogue important avec leurs descendants 
seront amenes a gerer des groupes de processus. Bien entendu, tout ceci est egalement neces- 
saire lors de la creation de processus demons, comme nous le verrons dans la partie consacree 
a la programmation reseau. 
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Une presentation detaillee des permissions associees aux processus se trouve dans [Bach 
1989] Conception du systeme Unix. Nous avons egalement aborde les principes des capacites 
Posix. le qui permettent d'ameliorer la securite d'une application necessitant des privileges. II 
faut toutefois etre conscient que 1' implementation actuelle de ces capacites est loin d'etre 
aussi riche que ce que propose Posix. le. 
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Une application peut etre executee, sous Unix, dans des contextes tres differents. II existe une 
multitude de types de terminaux, et le repertoire personnel de Futilisateur peut se trouver a 
n'importe quel endroit du systeme de fichiers (par exemple, les utilisateurs speciaux news, 
guest ou uucp). De plus, la plupart des applications permettent une configuration de leur inter- 
face en fonction des preferences de Futilisateur. 

II est done souvent necessaire d' avoir acces a differents parametres de Fenvironnement dans 
lequel s'execute un programme. Pour cela, les systemes Unix offrent une maniere assez 
elegante de transmettre aux applications des informations relatives aussi bien au systeme en 
general (type de systeme d' exploitation, nom de l'hote. . .) qu'a Futilisateur lui-meme (empla- 
cement du repertoire personnel, langage utilise, fichier contenant le courrier en attente), voire 
aux parametres n'ayant trait qu'a la session en cours (type de terminal. . .). 

Nous allons voir dans un premier temps les moyens d'acceder aux variables d'environnement, 
ainsi qu'une liste des variables les plus couramment utilisees. Nous etudierons par la suite 
Faeces aux arguments en ligne de commande, comprenant aussi bien les options simples, a la 
maniere SUSv3, que les options longues Gnu. Enfin, nous terminerons ce chapitre en obser- 
vant un exemple complet de parametrage d'une application en fonction de son environnement 
d'execution. 

Variables d'environnement 

Les variables d'environnement sont definies sous la forme de chaines de caracteres contenant 
des affectations du type NOM=VALEUR. Ces variables sont accessibles aux processus, tant dans 
les programmes en langage C que dans les scripts shell, par exemple. Lors de la duplication 
d'un processus avec un f ork( ), le fils herite d'une copie des variables d'environnement de son 
pere. Un processus peut modifier, creer ou detruire des variables de son propre environne- 
ment, et done de celui des processus fils a venir, mais en aucun cas il ne peut intervenir sur 
Fenvironnement de son pere. 
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Un certain nombre de variables sont automatiquement initialisees par le systeme lors de la 
connexion de l'utilisateur. D'autres sont mises en place par les fichiers d' initialisation du 
shell, d'autres enfin peuvent etre utilisees temporairement dans des scripts shell avant de 
lancer une application. 

Lorsqu'un programme C demarre, son environnement est automatiquement copie dans un 
tableau de chames de caracteres. Ce tableau est disponible dans la variable globale environ, 
a declarer ainsi en debut de programme (elle n'est pas declaree dans les fichiers d'en-tete 
courants) : 

char ** environ. 

■ 

Ce tableau contient des chaines de caracteres terminees par un caractere nul, et se finit lui- 
meme par un pointeur nul. Chaque chaine a la forme NOM=VALEUR, comme nous l'avons 
precise. Voici un exemple de balayage de 1' environnement. 

exemple_environ.c : 

#include <stdio.h> 

extern char ** environ; 

int 
main (void) 
{ 

int i = 0; 

for (i = 0; environ[i] != NULL; i ++) 

fprintf (stdout, "%d : %s\n", i, environ[i]); 

return 0; 

} 

Voici un exemple d' execution (raccourci) : 
$ ./exemple_environ 



0 


HISTSIZE=1000 


1 


HOSTNAME=tracy 


2 


L0GNAME=ccb 


3 


HISTFILESIZE=1000 


4 


MAI L=/var /spool /mail 


[.. 


] 


17 


LC_ALL=f r_FR 


18 


DISPLAY=:0.0 


19 


LANG^f r_FR 


20 


0STYPE=Linux 


21 


MM_CHARSET=IS0-8859 


22 


WIND0WID=29360142 


23 


SHLVL=2 


24 


_= . /exempl e_envi ron 
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Figure 3.1 

Variables d 'environnement 
d'un processus 



environ 



environ[0] 
environ[1] 



environ[24] 
environ [25] 



NULL 



S H L V L = 2 \0 



Notons que le tableau d' environnement est egalement fourni comme troisieme argument a la 
fonction main( ) , comme les options de ligne de commande argc et argv, que nous verrons 
plus bas. La norme SUSv3 recommande, pour des raisons de portabilite, d'eviter d'utiliser 
cette possibilite et de lui preferer la variable globale envi ron. Voici toutefois un exemple qui 
fonctionne parfaitement sous Linux. 

exemple_environ 2.c : 

#include <stdio.h> 

int 

main (int argc, char * argv[], char * envp[]) 

{ 

int i = 0; 

for (i = 0; envp[i] != NULL; i ++) 

fprintf (stdout, "Id : %s\n", i, envp[i]); 

return 0; 

} 

On peut parfois avoir besoin de balayer le tableau envi ron, mais c'est assez rare, car les appli- 
cations ne s'interessent generalement qu'a un certain nombre de variables bien precises. Pour 
cela, des fonctions de la bibliotheque C donnent acces aux variables d' environnement afin de 
pouvoir en ajouter, en detruire, ou en consulter le contenu. 

Precisons tout de suite que les chaines de caracteres attendues par les routines de la biblio- 
theque sont de la forme N0M=VALEUR, oil il ne doit pas y avoir d'espace avant le signe egal (=). 
En fait, un espace present a cet endroit serait considere comme faisant partie du nom de la 
variable. Notons egalement que la differenciation entre minuscules et majuscules est prise en 
compte dans les noms de variables. Les variables d'environnement ont des noms traditionnel- 
lement ecrits en majuscules (bien que cela ne soit aucunement une obligation), et une chaine 
Home=. . . n'est pas considered comme etant equivalente a H0ME=. . . 

La routine getenv( ) est declaree dans <stdl i b. h>, ainsi : 
char * getenv (const char * nom) ; 
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Elle permet de rechercher une variable d'environnement. On lui donne le nom de la variable 
desiree, et elle renvoie un pointeur sur la chaine de caracteres suivant immediatement le 
signe = dans F affectation NOM=VALEUR. Si la variable n'est pas trouvee, la routine renvoie un 
pointeur NULL. 

Avec la GlibC, cette routine renvoie directement un pointeur sur la chaine de l'environnement 
du processus. Elle n'effectue pas de copie de la chaine d'environnement. Aussi, toute modifi- 
cation apportee sur la chaine renvoyee affectera directement l'environnement du processus 
comme si on modifiait la variable globale envi ron. D'autres implementations peuvent preferer 
recopier le contenu de la chaine dans une variable globale statique, ecrasee a chaque appel. 

Precisons bien que la norme SUSv3 interdit toute modification sur le pointeur renvoye et 
indique qu'il faut faire une copie de la chaine renvoyee si on desire la reutiliser par la suite. 

Remarquons egalement que cette fonction n'est ni necessairement reentrante, ni sure dans un 
contexte multi-threads. Nous verrons dans le chapitre 12 les mecanismes de protection 
(mutex par exemple) permettant de l'utiliser en toute securite. 

Une variable peut etre definie sans avoir de valeur (N0M=). Dans ce cas, la routine getenvO 
renverra un pointeur sur une chaine vide. 

exemple_getenv.c : 

#include <stdio.h> 
#include <stdlib.h> 

int 

main (int argc, char * argv[]) 
{ 

int i ; 

char * variable; 

if (argc == 1) { 

fprintf (stderr, "Utilisation : %s variable. . .\n", argv[0]); 
return 1; 

} 

for (i =1; i < argc; i ++) { 
variable = getenv(argv[i ] ) ; 
if (variable == NULL) 

fprintf (stdout, "%s : non definie\n", argv[i]); 

el se 

fprintf (stdout, "%s : %s\n", argv[i], variable); 

} 

return 0; 

} 

Ce programme permet de tester la valeur des variables d'environnement dont on lui transmet 
le nom sur la ligne de commande. Nous etudierons plus loin le fonctionnement des arguments 
argc et argv. 

$ ./exemple_getenv HOME LANG SHELL INEXISTANTE 

HOME : /home/ccb 
LANG : fr_FR 
SHELL : /bin/bash 
INEXISTANTE : non definie 
$ 



Acces a l'environnement I 

Chapitre 3 | 

Pour tester nos programmes, il est interessant de voir comment remplir les variables d'envi- 
ronnement au niveau du shell. Cela depend bien entendu du type d'interpreteur de commandes 
utilise. Certains shells font une difference entre leurs propres variables (qu'on utilise pour 
stocker des informations dans les scripts) et les variables de l'environnement qui seront trans- 
mises aux processus his. Voici les syntaxes pour les principaux interpreteurs de commandes 
utilises sous Linux : 

Avec les shells bash ou ksh : 

Assignation d'une variable du shell : 

NOM=VALEUR 
Visualisation d'une variable du shell : 
echo $N0M 

Visualisation de toutes les variables definies (internes au shell et environnement) : 
set 

Visualisation des variables d' environnement : 
env 

Exportation de la variable vers l'environnement : 

export NOM 
ou directement : 

export NOM=VALEUR 
Destruction d'une variable : 

unset NOM 
Avec le shell tcsh : 

Assignation d'une variable pour le shell uniquement : 

set NOM=VALEUR 
Assignation d'une variable de l'environnement : 

setenv NOM VALEUR 
Visualisation de la valeur d'une variable de l'environnement : 

printenv NOM 
Destruction d'une variable d' environnement : 

unsetenv NOM 

Les exemples que nous donnerons seront realises avec bash, mais on pourra facilement les 
transformer pour d'autres shells. 

$ ESSAI=UN 

$ ./exemple_getenv ESSAI 

ESSAI : non definie 
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$ export ESSAI 

$ ./exemple_getenv ESSAI 

ESSAI : UN 

$ unset ESSAI 

$ ./exemple_getenv ESSAI 

ESSAI : non definie 

$ export ESSAI=DEUX 

$ export VIDE= 

$ ./exemple_getenv ESSAI VIDE 

ESSAI : DEUX 

VIDE : 

$ 

Les routines putenv( ) et setenv( ) servent a creer une variable d'environnement ou a en modi- 
fier le contenu. Elles sont toutes deux declarees dans <stdl i b . h> : 

I int putenv (const char * chaine) ; 

int setenv (const char * nom, const char * valeur, int ecraser) ; 

La fonction putenv( ) ne prend qu'un seul argument, une chaine du type NOM=VALEUR, et fait 
appel a setenv( ) apres avoir separe les deux elements de Faffectation. 

La routine setenv( ) prend trois arguments : les deux premiers sont les chaines NOM et VALEUR, 
et le troisieme est un entier indiquant si la variable doit etre ecrasee dans le cas ou elle existe 
deja. Le fait d'utiliser un troisieme argument nul permet de configurer, en debut d' application, 
des valeurs par defaut, qui ne seront prises en compte que si la variable n'est pas deja remplie. 

Ces deux routines renvoient zero si elle reussissent, ou -1 s'il n'y a pas assez de memoire 
pour creer la nouvelle variable. 

La routine unsetenv( ) permet de supprimer une variable : 

void unsetenv (const char * nom) ; 

Cette routine recherche la variable dont le nom lui est transmis, l'efface si elle la trouve, et ne 
renvoie rien. 

Un effet de bord - discutable - de la fonction putenv ( ) , fournie par la bibliotheque GlibC, est 
le suivant : si la chaine transmise a putenv ( ) ne contient pas de signe egal (=), cette demiere 
est considered comme le nom d'une variable, qui est alors supprimee de l'environnement en 
invoquant unsetenvt ). 

Les routines getenv( ), setenv( ) et unsetenv( ) de la bibliotheque GlibC balayent le tableau 
d'environnement pour rechercher la variable desiree en utilisant la fonction strncmp( ). Elles 
sont done sensibles, comme nous l'avons deja precise, aux differences entre majuscules et 
minuscules dans les noms de variables. 

Notons l'existence, avec GlibC, d'une routine clearenvO, declaree dans <stdlib.h>. Cette 
routine n'a finalement pas ete definie dans la norme SUSv3 et reste done d'une portabilite 
limitee. Elle sert a effacer totalement l'environnement du processus appelant (ce qui presente 
vraiment peu d'interet pour une application classique). 

Les modifications apportees par un programme C ne jouent que dans son environnement - et 
celui de ses futurs et eventuels descendants -, mais pas dans celui de son processus pere (le 
shell). Pour visualiser Taction des routines decrites ci-dessus, nous devrons done ecrire un 
programme un peu plus long que d' habitude. 
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exemple_putenv.c : 

#include <stdio.h> 
#include <stdlib.h> 

void recherche_variable (char * nom); 

int 
main (void) 

{ 

fprintf (stdout, "\n — test de putenvO — \n"); 

recherche_variable("ESSAI") ; 

fprintf (stdout, "putenv(\"ESSAI=UN\" ) ; \n" ) ; 

putenv("ESSAI=UN") : 

recherche_variable("ESSAI") ; 

fprintf (stdout, "putenv(\"ESSAI=\") ;\n") ; 

putenv( " ESSAI =" ) ; 

recherche_variable("ESSAI") ; 

fprintf (stdout, "putenv(\"ESSAI\") ; equivaut a unsetenvt )\n" ) ; 
putenv( "ESSAI " ) ; 
recherche_variable("ESSAI") ; 

fprintf (stdout, "\n — test de setenvO — \n"); 
recherche_variable("ESSAI") ; 

fprintf(stdout, "setenv(\"ESSAI\" , \"DEUX\", l);\n") ; 
setenvC'ESSAI", "DEUX", 1); 
recherche_variable("ESSAI") ; 

fprintf(stdout, "setenv(\"ESSAI\" , V'TROISW l);\n") : 
setenvC'ESSAI", "TROIS", 1); 
recherche_variable("ESSAI") ; 

fprintf (stdout, "setenv(\"ESSAI\" , V'QUATREV , 0);" 

" ecrasement de valeur non autoriseAn") ; 
setenvC'ESSAI", "QUATRE", 0); 
recherche_variable("ESSAI") ; 

fprintf (stdout, "\n-- test de unsetenvt) -- \n"); 

recherche_variable("ESSAI") ; 

fprintf (stdout , "unsetenv(\"ESSAI\" ) ;\n" ) ; 

unsetenvCESSAl") ; 

recherche_variable("ESSAI") ; 

return 0; 



void 

recherche_variable (char * nom) 
{ 

char * valeur; 

fprintf (stdout, " variable %s ", nom); 
valeur = getenv(nom) ; 
if (valeur == NULL) 

fprintf (stdout, "inexistante\n") ; 
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el se 

fprintf (stdout, "= £s\n", valeur); 

} 

Et voici un exemple d' execution : 
$ ./exemple_putenv 

— test de putenv( ) — 
variable ESSAI inexistante 

putenv("ESSAI=UN"); 

variable ESSAI = UN 
putenvt "ESSAI=" ) ; 

variable ESSAI = 
putenvt "ESSAI" ) ; equivaut a unsetenvO 

variable ESSAI inexistante 

— test de setenvO — 
variable ESSAI inexistante 

setenvt "ESSAI" , "DEUX", 1); 

variable ESSAI = DEUX 
setenv( "ESSAI", "TROIS", 1); 

variable ESSAI = TROIS 
setenvt "ESSAI" , "QUATRE", 0); ecrasement de valeur non autorise 

variable ESSAI = TROIS 

-- test de unsetenvO -- 

variable ESSAI = TROIS 
unsetenvC'ESSAI"); 

variable ESSAI inexistante 

$ 

Variables d'environnement couramment utilisees 

Un certain nombre de variables sont toujours disponibles sur les machines Linux et peuvent 
etre employees par les applications desirant s'informer sur le systeme dans lequel elles 
s'executent. Pour voir comment l'environnement des processus est constitue, il est interessant 
de suivre leur heritage depuis le demarrage du systeme. 

A tout seigneur tout honneur, le noyau lui-meme commence par remplir l'environnement du 
processus initial (qui deviendra ensuite in it) avec les chaines suivantes (dans /usr/src/ 
linux/im't/main.c) : 

H0ME=/ 
TERM=1 inux 

Le noyau recherche le fichier init dans les emplacements successifs suivants : /sbin/init, 
/etc/init et /bin/init. Puis, il le lance. 

Le fichier /sbin/init est generalement fourni sous Linux, aussi bien sur les systemes Red 
Hat que Slackware, ou Debian, dans le package SysVinit, qui comprend un certain nombre 
d'utilitaires comme init, shutdown, halt, last ou reboot. 
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Ce programme init configure plusieurs variables d'environnement. 

PATH=/usr/local/sbin:/sbin:/bin:/usr/sbin:/usr/bin 
RUNLEVEL=niveau d'execution 

PREVLEVEL=niveau precedent (en cas de redemarrage a chaud) 
CONSOLE=peripherique console 

Ensuite, il analyse le fichier /etc/inittab et en decode les differents champs. Nous allons 
suivre simplement l'exemple d'une connexion sur un terminal virtuel, decrite par une ligne : 

1: 12345 :respawn:/sbin/mingetty ttyl 

Dans cette configuration, c'est le programme mingetty qui est utilise pour surveiller la ligne 
de connexion (ttyl) et declencher ensuite /bin/login. Au passage, mingetty configure la 
variable : 

TERM=1 inux 

Le programme /bin/logi n appartient au package util-linux, qui contient un nombre important 
d'utilitaires. Ce programme commence par verifier l'identite de l'utilisateur et en deduit son 
shell de connexion (laplupart du temps grace au fichier /etc/passwd). Si 1 ogin a recu l'option 
-p en argument, il conserve l'environnement original, sinon il le detruit en conservant la 
variable TERM. Ensuite, il configure les variables suivantes : 

HOME=repertoi re de l'utilisateur (lu dans /etc/passwd) 
SHELI_=shell de connexion (idem) 
TERM=linux (inchange) 

PATH=/usr/bin:/bin (declare par la constante _PATH_DEFPATH dans <paths.h>) 
MAIL=emplacement du fichier de botte a lettres de l'utilisateur 
LOGNAME=nom de l'utilisateur 
USER=nom de l'utilisateur 

La redondance des deux dernieres variables s'explique par la difference de comportement 
entre les programmes de type BSD (qui preferent USER) et ceux de type Systeme V, qui utili- 
sent LOGNAME. 

Le programme /bin/login lance ensuite le shell choisi par l'utilisateur dans le fichier /etc/ 
passwd. Le shell configure lui-meme un certain nombre de variables d'environnement depen- 
dant de l'interpreteur. Enfin, il lit certains fichiers d'initialisation pouvant eux-memes 
contenir des affectations de variables d'environnement. Ces fichiers peuvent etre generaux 
pour le systeme (par exemple, /etc/profile) ou specifiques a l'utilisateur (-/.profile). 
Leurs noms peuvent egalement varier en fonction du shell utilise. 

En plus des variables d'environnement « classiques » que nous allons voir ci-dessous, une 
application peut tres bien faire varier son comportement en fonction de variables qui lui sont 
tout a fait propres. Une application foo peut rechercher ses fichiers de configuration dans le 
repertoire signale dans la variable FOOD I R, et creer ses fichiers temporaires dans le repertoire 
indique dans la variable FOOTMP. Bien entendu, si ces variables n'existent pas, l'application 
devra prevoir des valeurs par defaut. II sera alors plus facile pour l'utilisateur de se creer un 
script shell de lancement de l'application (par exemple avec bash) : 

#! /bin/sh 



export FOODIR=/usr/local/lib/foo/ 
export F00CFG=$H0ME/.foo/ 
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export F00TMP=/tmp/foo/ 
J exec /usr/local/bin/foo 

Les variables d'environnement les plus couramment utilisees sont les suivantes : 

• HOME contient le repertoire personnel de l'utilisateur. 

• PATH indique la liste des repertoires oil on recherche les fichiers executables. Ces reper- 
toires sont separes par des deux-points ' : ' . 

• PWD correspond au repertoire de travail du shell lors du lancement de 1' application. 

• LANG indique la localisation choisie par l'utilisateur, completee par les variables LC_ALL, 
LC_COLLATE, LC_CTYPE, LC_MONETARY, LC_NUMERIC, LC_TIME. Ces variables seront detaillees 
dans le chapitre consacre a Finternationalisation. 

• LOGNAME et/ou USER contiennent le nom de l'utilisateur. 

• TERM correspond au type de terminal utilise. 

• SHELL indique le shell de connexion de l'utilisateur. 

D'autres variables sont plutot liees au comportement de certaines routines de bibliotheque, 
comme : 

• TMPDIR est analysee par les routines tempnam( ), tmpnam( ), tmpf i 1 e( ) , etc. 

• POSIXLY_CORRECT modifie le comportement de certaines routines pour qu'elles soient stric- 
tement conformes a la norme Posix (SUSv3). Ainsi getopt( ) , que nous verrons plus bas, 
agit differemment suivant que la variable est definie ou non avec les arguments qu'elle 
rencontre sur la ligne de commande et qui ne representent pas des options valides. 

• MALLOC_xxx represente toute une famille de fonctions permettant de controler le comporte- 
ment des routines d' allocation memoire du type mallocO. 

• TZ correspond au fuseau horaire et modifie le comportement de tzset( ). 

Bien entendu, le comportement de nombreuses routines est influence par les variables de 
localisation LC_xxx. 

Lorsqu'une application utilise les variables d'environnement pour adapter son comportement, 
il est tres fortement recommande de bien documenter l'utilisation qu'elle en fait (dans la 
section Environnement de sa page de manuel, par exemple). 

Arguments en ligne de commande 

Les programmes en langage C recoivent traditionnellement, dans un tableau de chaines de 
caracteres, les arguments qui leur sont transmis sur leur ligne de commande. Le nombre 
d' elements de ce tableau est passe en premier argument de la fonction mai n ( ), et le tableau est 
transmis en second argument. Ces deux elements sont habituellement notes argc (args count, 
nombre d' arguments) et argv (args values, valeurs des arguments). 

Normalement, un programme recoit en premiere position du tableau argv (done a la posi- 
tion 0) son propre nom de fichier executable. 

Lorsqu'une application est lancee par un shell, la ligne de commande est analysee et 
decoupee en arguments en utilisant comme separateurs certains caracteres speciaux. Par 
exemple, avec bash la liste de ces caracteres est conservee dans la variable d'environnement 
I FS et contient l'espace, la tabulation et le retour chariot. 
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Une application peut done parcourir sa ligne de commande. 
exemple_argv.c : 

#include <stdio.h> 

int 

main (int argc, char * argv []) 

{ 

int i ; 

fprintf (stdout, "%s a recu en argument :\n", argv[0]); 
for (i = 1; i < argc; i ++) 

fprintf (stdout, " %s\n", argv[i]); 
return 0; 

} 

Voici un exemple d' execution, montrant que le shell a considere comme un argument unique 
l'ensemble "def ghi " , y compris l'espace, grace a la protection qu'offraient les guillemets, 
mais que celle-ci est supprimee lorsqu'on fait preceder les caracteres d'un antislash (\) et 
qu'ils deviennent alors des caracteres normaux : 

$ ./exemple_argv a be "def ghi" V'jkl mno\" 

. /exempl e_argv a recu en argument : 
a 

be 

def ghi 

"jkl 

mno" 

$ 

Par convention, le tableau argv [] contient (argc + 1) elements, le dernier etant un pointeur 
NULL. 



Figure 3.2 
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Certains programmes peuvent parfaitement se contenter d' analyser ainsi leur ligne de 
commande, surtout si on ne doit y trouver qu'un nombre fixe d' arguments (par exemple, 
uniquement un nom de fichier a traiter), et si aucune option n'est prevue pour modifier le 
deroulement du processus. 
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Toutefois, la plupart des applications permettent a Futilisateur d'indiquer des options en ligne 
de commande et de fournir de surcroit des arguments qui ne sont pas des options. Nous 
faisons ici la distinction entre les options du type -v - r -f , etc., qu'on trouve dans la plupart 
des utilitaires Unix, et les autres arguments, comme les noms de fichiers a copier pour la 
commande cp. La bibliotheque GlibC offre des fonctions puissantes pour 1' analyse automa- 
tique de la ligne de commande afin d'en extraire les arguments qui representent des options. 

Signalons aussi que certaines options prennent elles-memes un argument. Par exemple, 
l'option -S de la version GNU de cp reclame un argument representant le suffixe a utiliser 
pour conserver une copie de secours des fichiers ecrases. 

Options simples - SUSv3 

Les options, a la maniere SUSv3, sont precedees d'un tiret (-), et sont representees par un 
caractere alphanumerique simple. On peut toutefois regrouper plusieurs options a la suite du 
meme tiret (par exemple, -a -b -c equivalent a -abc). Si une option necessite un argument, 
elle peut en etre separee ou non par un espace (-a f i chier equivaut a -af ichier). 

L'option speciale « - - » (deux tirets) sert a indiquer la fin de la liste des options. Tous les 
arguments a la suite ne seront pas considered comme des options. On peut ainsi se debarrasser 
d'un fichier nomme « -f » avec la commande rm -- -f. 

Un tiret isole n'est pas considere comme une option. II est transmis au programme comme un 
argument non option. 

Normalement, Futilisateur doit fournir d'abord les options sur sa ligne de commande, et 
ensuite uniquement les autres arguments. Toutefois, la bibliotheque GlibC reordonne au 
besoin les arguments de la ligne de commande. 

Pour lire aisement les options fournies a une application, la bibliotheque C offre la fonction 
getoptO et les variables globales optind, opterr, optopt et optarg, declarees dans 
<unistd.h> : 

int getopt (int argc, const char * argv [], const char * options); 
extern int optind ; 
extern int opterr ; 
extern int optopt ; 
extern char * optarg ; 

On transmet a la fonction getopt( ) les arguments argc et argv qu'on a recus dans la fonction 
main( ), ainsi qu'une chame de caracteres indiquant les options reconnues par le programme. 
A chaque invocation de la fonction, celle-ci nous renverra le caractere correspondant a 
l'option en cours, et la variable globale externe optarg pointera vers l'eventuel argument de la 
fonction. Lorsque toutes les options auront ete parcourues, getopt () nous renverra -1, et 
la variable externe opti nd contiendra le rang du premier element de a rgv [ ] qui ne soit pas une 
option. 

Si getopt ( ) rencontre un caractere d' option non reconnu, elle affiche un message sur le flux 
stderr . Si la variable externe globale opterr ne contient pas 0, elle copie le caractere inconnu 
dans la variable globale externe optopt et renvoie le caractere '?'. 

La chame de caracteres qu'on transmet en troisieme argument a getopt( ) contient la liste de 
tous les caracteres d'option reconnus. Si une option prend un argument, on fait suivre le 
caractere d'un deux-points ' : '. 
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Voici un premier exemple d' analyse des options en ligne de commande, dans lequel le 
programme reconnait les options a, b, X, Y seules, et l'option -c suivie d'un argument. Si un 
caractere d' option n'est pas reconnu, nous gererons nous-meme Faffichage d'un message 
d'erreur. Enfin, une fois terminee 1' analyse des options, nous afficherons un a un les argu- 
ments restants (qui pourraient representer par exemple des noms de fichiers a traiter). 

exemple_getopt.c : 

#include <stdio.h> 
#include <unistd.h> 

int 

main (int argc, char * argv []) 

{ 

char * 1 iste_options = "abc:XY"; 
int option; 

opterr = 0; /* Pas de message d'erreur automatique */ 

while ((option = getopt(argc, argv, 1 iste_options) ) != -1) { 
switch (option) { 
case 'a' : 

fprintf (stdout, "Option a\n"); 
break; 
case 'b' : 

fprintf (stdout, "Option b\n"); 
break; 
case 'c' : 

fprintf (stdout, "Option c &s\n", optarg); 
break; 
case 'X' : 



case 'Y' : 

fprintf (stdout, "Option %c\n" . option); 
break; 
case '?' : 

fprintf (stderr, "Option %c fausse\n", optopt); 



break; 



if (optind != argc) { 

fprintf (stdout, "Arguments restants :\n"); 



while (optind != argc) 
fprintf (stdout, " 



%s\n", argv[optind ++]); 



return 0; 

} 
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Voici un exemple d' execution regroupant une bonne partie des fonctionnalites disponibles 
avec getoptC ) : 

$ ./exemple_getopt -abd -c 12 -XY suite et fin 

Option a 
Option b 
Option d fausse 
Option c 12 
Option X 
Option Y 

Arguments restants : 
suite 
et 
fin 

$ 

La variable externe globale optarg, qu'on utilise pour acceder a 1' argument de certaines 
options, est en realite un pointeur, de type char *, dirige vers l'element de argv[] qui corres- 
pond a la valeur desiree. II n'est done pas necessaire de copier la chaine de caracteres si on 
desire Futiliser plus tard ; on peut directement copier la valeur du pointeur, puisque le tableau 
argv[] ne doit plus varier apres l'invocation de getoptO. Nous verrons un exemple plus 
concret d'utilisation de cette chaine de caracteres dans le programme nomme exemple_ 
opti ons . c, fourni a la fin de ce chapitre. 

Options longues - Gnu 

Les applications issues du projet Gnu ont ajoute un autre type d'options qui ont ete incor- 
porees dans les routines d'analyse de la ligne de commande : les options longues. II s'agit 
d'options commencant par deux tirets « - - », et dont le libelle est exprime par des mots 
complets. Par exemple, la version Gnu de Is accepte l'option longue --numeric-uid-gid de 
maniere equivalente a -n. 

Bien entendu, ces options ne sont pas prevues pour etre utilisees quotidiennement en ligne de 
commande. Peu d'utilisateurs preferent saisir 

In --symbolic --force foo bar 

a la place de 

In -sf foo bar 

Par contre, ces options longues sont tres commodes lorsqu'elles sont utilisees dans un script 
shell, oil elles permettent d' auto-documenter les arguments fournis a une commande peu 
utilisee. 

Les options longues peuvent bien entendu accepter des arguments, qui s'ecrivent aussi bien 

--option valeur 
que 

--option=valeur 

Une option longue peut etre abregee tant qu'il n'y a pas d'ambigui'te avec d'autres options de 
la meme commande. La bibliotheque GlibC offre des routines d'analyse des options longues 
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assez semblables a la routine getopt( ) ; il s'agit de getoptjl ong( ) et de getopt_l ong_only( ). 
Ces routines sont declarees dans le fichier d'en-tete <getopt.h> et non dans <unistd.h>. La 
fonction getopt_l ong( ) a le prototype suivant : 

int getopt_long (int argc, char * argv [], 
const char * optsring, 
const struct option * longopts, 
int * longindex); 

Attention toutefois aux problemes de portability : me me si elle n'existe pas sur tous les 
systemes, la routine getopt( ) est definie par SUSv3 et est done tres repandue sous Unix. Par 
contre, les options longues (et meme le fichier d'en-tete <getopt . h>) sont des extensions Gnu 
largement moins courantes. Si une application doit etre portable sous plusieurs systemes 
Unix, il est conseille d'encadrer les portions de code specifiques aux options longues par des 
directives #ifdef / #endif permettant a la compilation de basculer au choix avec ou sans 
options longues. 

La routine getopt_l ong( ) prend argc et argv[] en premiers arguments comme getoptO. 
Ensuite, on lui transmet egalement une chaine de caracteres contenant les options courtes, 
exactement comme getoptO. Puis viennent deux arguments supplementaires : un tableau 
d'objets de type struct option, et un pointeur sur un entier. La structure struct option est 
definie dans le fichier d'en-tete <getopt.h> ainsi : 



Nom 


Type 


Signification 


name 


char * 


Nom de I'option longue. 


has_arg 


int 


Loption reclame-t-elle un argument supplemental ? 


flag 


int 


Maniere de renvoyer la valeur ci-dessous. 


val 


int 


Valeur a renvoyer quand I'option est trouvee. 



Chaque element du tableau longopts contient une option longue, le dernier element devant 
etre obligatoirement rempli avec des zeros. 

Le premier champ comprend simplement le nom de I'option. C'est une chaine de caracteres 
classique, terminee par un caractere nul. Le second champ indique si I'option doit etre suivie 
par un argument. II y a trois possibilites, decrites par des constantes symboliques dans le 
fichier <getopt . h> : 

• no_argument (0) : I'option ne prend pas d'argument. 

• requi red_argument (1) : I'option prend toujours un argument. 

• optional_argument (2) : l'argument est eventuel. 

Le troisieme champ est plus complique. S'il est NULL (c'est le cas le plus courant), l'appel a 
getopt_l ong( ) renverra, lorsqu'il trouvera I'option, la valeur indiquee dans le champ val . Ce 
principe est done assez semblable a celui qu'on a deja vu pour getopt( ), et il est meme habi- 
tuel de mettre dans le champ val le caractere correspondant a I'option courte equivalente, afin 
d'avoir un traitement swi tch/case unique. Dans le cas ou ce troisieme champ (f 1 ag) n'est pas 
NULL, il faut le faire pointer vers une variable de type int, par exemple une variable declaree 
dans la fonction main(), dans laquelle getoptjl ong( ) ecrira la valeur contenue dans le champ 
val si I'option est rencontree. Dans un tel cas, getopt^l ong( ) renvoie 0. 
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Lorsque getopt_l ong( ) rencontre une option courte (contenue dans la chaine optstring), 
elle se comporte exactement comme getopt( ). Lorsqu'elle rencontre une option longue, elle 
remplit la variable pointee par 1 ongi ndex avec l'indice de Foption en question dans le tableau 
1 ongopts. Comme pour les options courtes, les arguments eventuels sont transmis par le poin- 
teur global optarg. Celui-ci est NULL si Foption n'a pas d'argument (ce qui sert dans le cas 
d' arguments optionnels). 

Pour remplir le tableau 1 ongopts que nous devons fournir a getopt_l ong( ), il est pratique 
d'utiliser l'initialisation automatique d'une variable statique de la fonction mainO. Nous 
allons ecrire un petit programme (qu'on peut imaginer comme un lecteur de fichiers video) 
acceptant les options suivantes : 

• --debut ou -d, suivie d'une valeur numerique entiere 

• --fin ou -f , suivie d'une valeur numerique entiere 

• --rapide 

• --lent 

Les deux dernieres options serviront a mettre directement a jour une variable interne du 
programme, en utilisant un champ f 1 ag non NULL. Nous ne traitons pas dans ce programme les 
arguments autres que les options (une fois que getopt_l ong( ) renvoie -1), et nous laissons a 
cette routine le soin d'afficher un message d'erreur en cas d' option non reconnue. 

exemple_getopt_long.c : 

#include <stdio.h> 
//include <stdlib.h> 
//include <getopt.h> 

int vitesse_lecture = 0; 
/* -1 = lent, 0 = normal, 1 = rapide */ 



int 

main (int argc, char * argv[]) 



char * optstring = "d:f:"; 
struct option longopts[] = { 



/* name has_arg flag 

{ "debut", 1, NULL, 

{ "fin", 1, NULL, 



val */ 

•d' }, 

•f }, 

1 1, 

-1 ), 



{ "rapide", 0, & vitesse_lecture, 

{ "lent", 0, & vitesse_lecture, 

/* Le dernier element doit etre nul */ 



{ NULL, 0, NULL, 

}; 



0), 



int 
int 
int 
int 



longindex; 
option; 



debut = 0; 
fin = 999; 
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while ((option = getopt_long(argc, argv, 

optstring, longopts, & longindex)) != -1) { 

switch (option) { 

case 'd' : 

if (sscanf(optarg, "Id." , & debut) != 1) { 
fprintf (stderr, "Erreur pour debut\n"); 

} 

break; 
case "f : 

if (sscanf(optarg, "Id", & fin) != 1) { 
fprintf (stderr, "Erreur pour finAn"); 

} 

break; 
case 0 : 

/* vitesse_lecture traitee automatiquement */ 
break; 
case '?' : 

/* On a laisse opterr a 1 */ 
break; 

} 

} 

fprintf (stdout, "Vitesse ltd, debut %d, fin %d\n", 
vitesse_lecture, debut, fin); 

return 0; 

} 

En voici un exemple d'execution : 

$ ./exemple_getopt_long --rapide -d 4 --fin 25 

Vitesse 1, debut 4, fin 25 
$ 

II existe egalement avec la GlibC une routine getopt_l ong_only( ) fonctionnant comme 
getopt_l ong( ), a la difference que meme une option commencant par un seul tiret (-) est 
considered d'abord comme une option longue puis, en cas d'echec, comme une option courte. 
Cela signifie que -ab sera d'abord considered comme equivalant a --ab (done comme une 
abreviation de --abort) avant d'etre traitee comme la succession d'options simples -a -b. Cet 
usage peut induire l'utilisateur en erreur, et cette routine me semble peu recommandable. . . 



Sous-options 

L' argument qu'on fournit a une option peut parfois necessiter lui-meme une analyse pour etre 
separe en sous-options. La bibliotheque C fournit dans <stdlib.h> une fonction ayant ce 
role : getsuboptO. La declaration n'est presente dans le fichier d'en-tete que si la constante 
symbolique _X0PEN_S0URCE est definie et contient la valeur 500, ou si la constante _GNU_S0URCE 
est definie. 

L'exemple classique d'utilisation de cette fonction est l'option -o de la commande mount. 
Cette option est suivie de n'importe quelle liste de sous-options separees par des virgules, 
certaines pouvant prendre une valeur (par exemple -o async , noexec , bs=512). 
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Le prototype de getsubopt( ) est le suivant : 

int getsubopt (char ** option, const char * const * tokens, 
char ** val ue) ; 

Cette routine n'est appelee que lorsqu'on se trouve dans le case correspondant a l'option a 
analyser de nouveau (par -o pour mount). II faut transmettre un pointeur en premier argument 
sur un pointeur contenant la sous-option. En d'autres termes, on cree un pointeur char * 
subopt qu' on fait pointer sur la chaine a analyser (subopt = optarg), et on transmet & subopt 
a la fonction. Celle-ci avancera ce pointeur d'une sous-option a chaque appel, jusqu'a ce qu'il 
arrive sur le caractere nul de fin de optarg. 

Le second argument est un tableau contenant des chaines de caracteres correspondant aux 
sous-options. Le dernier element de ce tableau doit etre un pointeur NULL. 

Enfin, on transmet en dernier argument l'adresse d'un pointeur de chaine de caracteres. 
Lorsque la routine rencontre une sous-option suivie d'un signe egal '=', elle renseigne ce 
pointeur de maniere a l'amener au debut de la valeur. Elle inscrit egalement un caractere nul 
pour marquer la fin de la valeur. Si aucune valeur n'est disponible, val ue est rempli avec NULL. 

Si une sous-option est reconnue, son index dans la table tokens est renvoye. Sinon, getsubopt( ) 
renvoie -1. Un exemple de code permettant 1' analyse d'une sous -option sera fourni dans le 
programme exempl e_opti ons . c decrit ci-apres. 

Exemple complet d'acces a I'environnement 

Nous allons voir un exemple de code permettant de regrouper l'ensemble des fonctionnalites 
d'acces a I'environnement que nous avons vues dans ce chapitre. Nous allons imaginer qu'il 
s'agit d'une application se connectant par exemple sur un serveur TCP/IP, comme nous 
aurons l'occasion d'en etudier plus loin. 

Notre application doit fournir tout d'abord des valeurs par defaut pour tous les elements para- 
metrables. Ces valeurs sont etablies a la compilation du programme. Toutefois, on les regroupe 
toutes ensemble afin que l'administrateur du systeme puisse, s'il le desire, recompiler l'appli- 
cation avec de nouvelles valeurs par defaut. 

Ensuite, nous essaierons d'obtenir des informations en provenance des variables d'environ- 
nement. Celles-ci peuvent etre renseignees par l'administrateur systeme (par exemple dans 
/etc/profile) ou par l'utilisateur (dans -/.profile ou dans un script shell de lancement de 
1' application). 

Puis, nous analyserons la ligne de commande. II est en effet important que les options fournies 
manuellement par l'utilisateur aient la priorite sur celles qui ont ete choisies pour l'ensemble 
du systeme. 

Voyons la liste des elements dont nous allons permettre le parametrage. 

• Adresse reseau du serveur a contacter 

II s'agit ici d'une adresse IP numerique ou d'un nom d'hote. Nous nous contenterons 
d'obtenir cette adresse dans une chaine de caracteres et de laisser a la suite de 1' application 
les taches de conversion necessaires. Nous ne ferons aucune gestion d'erreur sur cette 
chaine, nous arrangeant simplement pour qu'elle ne soit pas vide. 
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Par defaut, la valeur sera local host. On pourra modifier Fadresse en utilisant la variable 
d'environnement 0PT_ADR. Les options -a et --adresse, suivies d'une chaine de caracteres, 
permettront une derniere configuration. 

• Port TCP a utiliser pour joindre le serveur 

Le port TCP sur lequel nous desirons contacter le serveur peut etre indique soit sous forme 
numerique, soit sous forme symbolique, en utilisant un nom decrit dans le fichier /etc/ 
services. Nous considererons done qu'il s'agit d'une chaine de caracteres, que le reste de 
1' application se chargera de convertir en numero de port effectif. 

Par defaut, nous prendrons une valeur arbitraire de 4 000, mais nous pourrons modifier 
cette valeur en utilisant la variable d'environnement 0PT_SRV , ou l'une des options -p ou 
--port, suivie d'une chaine de caracteres. 

• Options pour la connexion 

Afin de donner un exemple d'utilisation de la fonction getsubopt( ), nous allons permettre 
la transmission d'une liste de sous-options separees par des virgules, en utilisant l'option 
-o ou --option de la ligne de commande : 

auto / nonauto : il s'agit par exemple de tentative de reconnexion automatique au serveur 
en cas d'echec de transmission. Ce parametre est egalement configurable en definissant 
(ou non) la variable d'environnement 0PT_AUT0. Par defaut, le choix est nonauto. 

delai=<duree> : il s'agit du temps d'attente en secondes entre deux tentatives de recon- 
nexion au serveur. Cette valeur vaut 4 secondes par defaut, mais peut aussi etre modifiee 
par la variable d'environnement 0PT_DELAI. 

• Affichage de 1' aide 

Une option -h ou --hel p permettra d'obtenir un rappel de la syntaxe de 1' application. 

• Arguments autres que les options 

Le programme peut etre invoque avec d' autres arguments a la suite des options, par 
exemple des noms de fichiers a transferer, l'identite de l'utilisateur sur la machine distante, 
etc. Ces arguments seront affiches par notre application a la suite des options. 

Pour lire les sous-options introduites par l'option -o, une routine separee est utilisee, princi- 
palement pour eviter des niveaux d'indentation excessifs et inesthetiques en imbriquant deux 
boucles while et deux switch-case. 

Enfin, pour augmenter la portability de notre exemple, nous allons encadrer tout ce qui 
concerne les options longues Gnu par des directives #i f def - #el se - #endi f . Ainsi, la recom- 
pilation sera possible sur pratiquement tous les systemes Unix, a 1' exception peut-etre de la 
routine getsuboptO. Pour compiler l'application avec les options longues, sous Linux par 
exemple, il sufHra d'inclure une option -D0PTI0NS_L0NGUES sur la ligne de commande de gec 
(ou dans un fichier Makefile). Sur un systeme ou la bibliotheque C n'offre pas la routine 
getopt_l ong( ), il suffira de ne pas definir cette constante symbolique pour permettre la 
compilation. 

exemple_options.c : 

#include <stdio.h> 
^include <stdlib.h> 
#include <unistd.h> 
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#ifdef 0PTI0NS_L0NGUES 

#include <getopt.h> 
#endif 



/* Definition des valeurs par defaut. */ 
/* (pourraient etre regroupees dans un .h) */ 
//define ADRESSE_SERVEUR_DEFAUT "localhost" 
//define PORT_SERVEUR_DEFAUT "4000" 
//define C0NNEXION_AUTO_DEFAUT 0 
//define DELAI_C0NNEXI0N_DEFAUT 4 



void sous_options (char * ssopt, int * cnx_auto, int * delai); 

void suite_appl ication (char * adresse_serveur, 

char * port_serveur, 

int connexion_auto, 

int delai_reconnexion, 

int argc, 

char * argv [] ) ; 

void affiche_aide (char * nom_programme) ; 



int 

main (int argc, char * argv[]) 
{ 

/* 

* Copie des chaines d'envi ronnement. 

* II n'est pas indispensable sous Linux d'en faire une 

* copie, mais c'est une bonne habitude pour assurer la 

* portabilite du programme. 
*/ 

char * opt_adr = NULL; 
char * opt_srv = NULL; 
int opt_delai = 0; 
char * retour_getenv; 
/* 

* Variables contenant les valeurs effectives de nos parametres. 
*/ 

static char * adresse_serveur = ADRESSE_SERVEUR_DEFAUT; 
static char * port_serveur = P0RT_SERVEUR_DEFAUT; 
int connexion_auto = CONNEXI0N_AUT0_DEFAUT; 

int delai_connexion = DELAI_C0NNEXI0N_DEFAUT; 



int option; 
/* 

* Lecture des variables d'envi ronnement, on code en dur ici 

* le nom des variables, mais on pourrait aussi les regrouper 

* (par //define) en tete de fichier. 
*/ 

retour_getenv = getenv( "0PT_ADR" ) ; 

if ( ( retour_getenv != NULL) && (strl en( retour_getenv) != 0)) { 
opt_adr = malloc (strlen(retour_getenv) + 1); 
if (opt_adr != NULL) { 

strcpy(opt_adr, retour_getenv) ; 
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adresse_serveur = 
} else { 

perrorC'malloc") ; 
exit(l) ; 



opt_adr; 



retour_getenv = getenv( "0PT_SRV" ) ; 

if ( ( retour_getenv != NULL) && (strlen(retour_getenv) != 
opt_srv = malloc (strl en( retour_getenv) +1); 
if (opt_srv != NULL) { 

strcpy(opt_srv, retour_getenv) ; 

port_serveur = opt_srv; 
} else { 

perrorC'malloc") ; 

exit(l) ; 



0)) 



retour_getenv = getenvt "0PT_AUT0" ) ; 

/* II suffit que la variable existe dans l'environnement, 
/* sa valeur ne nous importe pas. 
if ( retour_getenv != NULL) 

connexion_auto = 1; 
retour_getenv = getenv( "0PT_DELAI" ) ; 
if (retour_getenv != NULL) 

if (sscanf (retour_getenv, , & opt_delai) == 1) 
delai_connexion = opt_delai; 

/* 

* On va passer maintenant a la lecture des options en ligne 

* de commande. 
*/ 

opterr = 1; 
while (1) { 

#ifdef 0PTI0NS_L0NGUES 

int index = 0; 

static struct option longopts[] = { 



"adresse 
"port" , 
"option" 
"help" , 
NULL, 
}; 

option 
#else 
option 
#endif 

if (option == 
break; 



NULL, 
NULL, 
NULL. 
NULL. 
NULL. 



a 

'P' 
'o' 
'h' 
0 } 



getopt_long(argc, argv 
getopt(argc, argv, "a:p:o:h") 
-1) 



:p:o:h", longopts, & index); 



switch (option) ( 
case 'a' : 

/* On libere une eventuelle copie de chaine */ 
/* d'envi ronnement equivalente. */ 
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if (opt_adr != NULL) 

f ree(opt_adr) ; 
opt_adr = NULL; 
adresse_serveur = optarg; 
break; 
case 'p' : 

/* idem */ 

if (opt_srv ! = NULL) 

f ree(opt_srv) ; 
opt_srv = NULL; 
port_serveur = optarg; 
break; 
case 'o' : 

/* on va analyser les sous-options */ 
sous_opt ions (optarg, 

& connexion_auto, 

& del ai_connexion) ; 

break; 
case 'h' : 

aff i che_aide(argv[0] ) ; 

exit(O) ; 
default : 

break; 

} 

} 

suite_appl ication(adresse_serveur , port_serveur, connexion_auto, 

delai_connexion, argc - optind, & (argv[optind])); 

return 0; 

} 

void 

sous_options (char * ssopt, int * cnx_auto, int * delai) 
{ 

int subopt; 
char * chaine = ssopt; 
char * value = NULL; 
int val_delai; 
char * tokens[] = { 

"auto", "nonauto", "delai", NULL 

}; 

while ((subopt = getsubopt(& chaine, tokens, & value)) != -1) { 
switch (subopt) { 

case 0 : /* auto */ 

* cnx_auto = 1; 
break; 

case 1 : /* nonauto */ 

* cnx_auto = 0; 
break; 

case 2 : /* delai=. . . */ 
if (value == NULL) { 

fprintf (stderr, "delai attendu\n"); 
break; 
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if (sscanf (value, 
fprintf (stderr, 
break; 



& val_delai) != 1) 
"del ai invalide\n") ; 



* del ai = val_del ai ; 
break; 



/* 

* La suite de 1 'application ne fait qu'afficher 

* les options et les arguments suppl ementai res 
*/ 

void 

suite_appl ication (char * adr_serveur, 
char * port_serveur, 
int cnx_auto, 
int delai_cnx, 
int argc, 
char * argv[]) 



int i; 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
for (i = 0; i < argc 
fprintf (stdout. 



Serveur : %s - £s\n", adr_serveur, 
Connexion auto : £s\n", cnx_auto ? 
Del a i : M\n", delai_cnx); 
Arguments supplementaires : "); 
i++) 

s - ", argv[i]); 



port_serveur) ; 
"oui " : "non" ) ; 



fprintf (stdout, "\n"); 



void 

affiche_aide (char * nom_prog) 
{ 

fprintf (stderr, "Syntaxe : %s [options] [fichiers. . .]\n", nom_prog); 

fprintf (stderr, "Options :\n"); 
#ifdef 0PTI0NS_LONGUES 

fprintf (stderr, " --help\n"); 
//endif 

fprintf (stderr, " 
#ifdef 0PTI0NS_L0NGUES 

fprintf (stderr, " 
//endif 

fprintf (stderr, " -a <serveur> 
#ifdef OPTI0NS_LONGUES 

fprintf (stderr, " 
#endif 

fprintf (stderr, " -p <num_port> Numero de port TCP \n") 
#ifdef 0PTI0NS_L0NGUES 

fprintf (stderr, " 
#endif 



h Cet ecran d 'aide \n" ) ; 

-adresse <serveur> \n"); 

Adresse IP du serveur \n" 
port <numero_port> \n"); 
<num_port> Numero de 
-option [sous_options]\n") ; 
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fprintf (stderr, 
fprintf (stderr, 
fprintf (stderr, 
fprintf (stderr, 

} 

Voici plusieurs exemples d' utilisation, ainsi que la ligne de commande a utiliser pour definir 
les constantes necessaires lors de la compilation : 

$ cc -D_GNU_SOURCE -D0PTI0NS_L0NGUES exempl e_options . c -o exemple_options 
$ . /exempl e_options 

Serveur : localhost - 4000 
Connexion auto : non 
Del ai : 4 

Arguments suppl ementai res : 
$ export 0PT_ADR="172.16.15.1" 
$ . /exempl e_options 

Serveur : 172.16.15.1 - 4000 
Connexion auto : non 
Del ai : 4 

Arguments suppl ementai res : 

$ export OPT_SRV="5000" 

$ . /exempl e_options --adresse "127.0.0.1" 

Serveur : 127.0.0.1 - 5000 
Connexion auto : non 
Del ai : 4 

Arguments suppl ementai res : 
$ export 0PT_AUT0= 

$ . /exempl e_options -p 6000 -odelai=5 
Serveur : 172.16.15.1 - 6000 
Connexion auto : oui 
Del ai : 5 

Arguments suppl ementai res : 

$ . /exempl e_options -p 6000 -odelai=5,nonauto et d autres arguments 

Serveur : 172.16.15.1 - 6000 
Connexion auto : non 
Del ai : 5 

Arguments suppl ementai res : et - d - autres - arguments 
$ 

Conclusion 

Nous voici done en possession d'un squelette complet de programme capable d'acceder a son 
environnement et permettant un parametrage a plusieurs niveaux : 

• a la compilation, par l'administrateur systeme, grace aux valeurs par defaut ; 

• globalement pour toutes les executions, par l'administrateur ou l'utilisateur, grace aux 
variables d' environnement ; 

• lors d'une execution particuliere grace aux options en ligne de commande. 

II est important, pour une application un tant soit peu complete, de permettre ainsi a l'utilisa- 
teur et a 1' administrateur systeme de configurer son comportement a divers niveaux. 



" -o [sous_options] \n"); 
"Sous-options :\n"); 

" auto / nonauto Connexion automatique \n"); 

" delai=<sec> Del a i entre deux connexions \n"); 
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Ce chapitre va etre principalement consacre aux debuts d'un processus. Tout d'abord, nous 
examinerons les methodes utilisables pour lancer un nouveau programme, ainsi que les meca- 
nismes sous-jacents, qui peuvent conduire a un echec du demarrage. 

Nous nous interesserons ensuite a des fonctions simplifiees, permettant d'utiliser une applica- 
tion independante comme une sous-routine de notre logiciel. 

Lancement d'un nouveau programme 

Nous avons deja vu que le seul moyen de creer un nouveau processus dans le systeme est 
d'invoquer f ork( ), qui duplique le processus appelant. De meme, la seule facon d'executer un 
nouveau programme est d'appeler l'une des fonctions de la famille exec(). Nous verrons 
egalement qu'il existe les fonctions popen( ) et system( ) , qui permettent d'executer une autre 
application mais en s'appuyant sur fork( ) et exec( ). 

L'appel de l'une des fonctions exec( ) permet de remplacer l'espace memoire du processus 
appelant par le code et les donnees de la nouvelle application. Ces fonctions ne reviennent 
qu'en cas d'erreur, sinon le processus appelant est entierement remplace. 

On parle couramment de 1' appel-systeme execO sous forme generique, mais en fait il 
n'existe aucune routine ayant ce nom. Simplement, il y a six variantes nominees execl (), 
execleO, execlpO, execvO, execveO et execvpO. Ces fonctions permettent de lancer une 
application. Les differences portent sur la maniere de transmettre les arguments et l'environ- 
nement, et sur la methode pour acceder au programme a lancer. II n'existe sous Linux qu'un 
seul veritable appel-systeme dans cette famille de fonctions : execve( ). Les autres fonctions 
sont implementees dans la bibliotheque C a partir de cet appel-systeme. 

Les fonctions dont le suffixe commencent par un "1" utilisent une liste d' arguments a trans- 
mettre de nombre variable, tandis que celles qui debutent par un "v" emploient un tableau a la 
maniere du vecteur a r g v [ ] . 
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Les fonctions se terminant par un "e" transmettent l'environnement dans un tableau envp [] 
explicitement passe dans les arguments de la fonction, alors que les autres utilisent la variable 
globale envi ron. 

Les fonctions se finissant par un "p" utilisent la variable d'environnement PATH pour recher- 
cher le repertoire dans lequel se situe F application a lancer, alors que les autres necessitent un 
chemin d'acces complet. La variable PATH est declaree dans l'environnement comme etant 
une liste de repertoires separes par des deux-points. On utilise typiquement une affectation du 
genre : 

PATH=/usr/bin:/bin:/usr/XllR6/bin/:/usr71ocal /bin:/usr/sbin:/sbin 

II est preferable de placer en tete de PATH les repertoires dans lesquels se trouvent les applica- 
tions les plus utilisees afin d'accelerer la recherche. Certains ajoutent a leur PATH un repertoire 
simplement compose d'un point, representant le repertoire en cours. Cela peut entrainer une 
faille de securite, surtout si ce repertoire « . » n'est pas place en dernier dans l'ordre de 
recherche. II vaut mieux ne pas le mettre dans le PATH et utiliser explicitement une commande : 

$ ./mon_prog 

pour lancer une application qui se trouve dans le repertoire courant. 

Quand execlpO ou execvpO rencontrent, lors de leur parcours des repertoires du PATH, un 
fichier executable du nom attendu, ils tentent de le charger. S'il ne s'agit pas d'un fichier 
binaire mais d'un fichier de texte commencant par une ligne du type : 

#! /bin/interpreteur 

le programme indique (i nterpreteur) est charge, et le fichier lui est transmis sur son entree 
standard. II s'agit souvent de /bin/sh, qui permet de lancer des scripts shell, mais on peut 
trouver d' autres fichiers a interpreter (/bin/awk, /usr/bin/perl, /usr/bin/wish...). Nous 
verrons une invocation de script shell plus loin. 

Si l'appel exec( ) reussit, il ne revient pas, sinon il renvoie -1, et errno contient un code expli- 
quant les raisons de l'echec. Celles-ci sont detaillees dans la page de manuel execve(2). 

Le prototype de execve( ) est le suivant : 

int execve (const char * appli, const char * argv [], 
const char * envp [] ) ; 

La chame "appl i" doit contenir le chemin d'acces au programme a lancer a partir du reper- 
toire de travail en cours ou a partir de la racine du systeme de fichiers s'il commence par un 
slash "/". 

Le tableau argv[] contient des chaines de caracteres correspondant aux arguments qu'on 
trouve habituellement sur la ligne de commande. 

La premiere chaine argv[0] doit contenir le nom de l'application a lancer (sans chemin 
d'acces). Ceci peut parfois etre utilise pour des applications qui modifient leur comportement 
en fonction du nom sous lequel elles sont invoquees. Par exemple, /bin/gzip sert a 
compresser des fichiers. II est egalement utilise pour decompresser des fichiers si on lui 
transmet l'option -d ou si on l'invoque sous le nom gunzip. Pour ce faire, il analyse argv[0]. 
Dans la plupart des distributions Linux, il existe d'ailleurs un lien physique nomme /bin/ 
gunzi p sur le meme fichier que /bin/gzi p. 
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Le troisieme argument est un tableau de chaines declarant les variables d'environnement. On 
peut eventuellement utiliser la variable externe globale environ si on desire transmettre le 
meme environnement au programme a lancer. Dans la majorite des applications, il est toute- 
fois important de mettre en place un environnement coherent, grace aux fonctions que nous 
avons etudiees dans le chapitre 3. Ceci est particulierement necessaire dans les applications 
susceptibles d'etre installees Set-UID root. 

Les tableaux argv [] et envp [] doivent se terminer par des pointeurs NULL. 

Pour montrer l'utilisation de execveO, nous allons invoquer le shell, en lui passant la 
commande echo SSHLVL. Le shell nous affichera alors la valeur de cette variable d'environne- 
ment. bash comme tcsh indiquent dans cette variable le nombre d' invocations successives du 
shell qui sont « empilees ». Voici un exemple sous bash : 

$ echo $SHLVL 

1 

$ sh 

$ echo $SHLVL 

2 

$ sh 

$ echo $SHLVL 

3 

$ exit 

$ echo $SHLVL 

2 

$ exit 

$ echo $SHLVL 

1 
$ 

Notre programme executera done simplement cette commande en lui transmettant son propre 
environnement. On notera que la commande echo SSHLVL doit etre transmise en un seul argu- 
ment, comme on le ferait sur la ligne de commande : 

$ sh -c "echo $SHLVL" 

2 
$ 

(L option -c demande au shell d'executer l'argument suivant, puis de se terminer.) 
exemple_execve.c : 

#include <stdio.h> 

^include <stdlib.h> 

#include <unistd.h> 

#include <errno.h> 

extern char ** environ; 



int 
main (void) 



char * argv[] = {"sh", "-c", "echo SSHLVL" , (char *) NULL }; 



fprintf (stdout, "Je lance /bin/sh -c V'echo $SHLVL\" :\n"); 
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execve("/bin/sh" , argv, environ); 

fprintf (stdout, "Rate : erreur = £d\n", errno); 
return 0; 

} 

Voici un exemple d' execution sous bash : 

$ echo $SHLVL 

1 

$ ./exemple_execve 

Je lance /bin/sh -c "echo $SHLVL" : 
2 

$ sh 

$ ./exemple_execve 

Je lance /bin/sh -c "echo $SHLVL" : 

3 

$ exit 

$ ./exemple_execve 

Je lance /bin/sh -c "echo $SHLVL" : 

2 

$ 

Bien entendu, le programme ayant lance un nouveau shell pour executer la commande, le 
niveau d' imbrication est incremente par rapport a la variable d'environnement, consultee 
directement avec echo $SHLVL. 

La fonction execv ( ) dispose du prototype suivant : 

int execv (const char * application, const char * argv []); 

Elle fonctionne comme execve( ) , mais l'environnement est directement transmis par Pinter- 
mediaire de la variable externe envi ron, sans avoir besoin d'etre passe explicitement en argu- 
ment durant l'appel. 

La fonction execvp( ) utilise un prototype semblable a celui de execv ( ), mais elle se sert de la 
variable d'environnement PATH pour rechercher l'application. Nous allons en voir un exemple, 
qui execute simplement la commande 1 s. 

exemple_execvp.c : 

#include <stdio.h> 

//include <stdlib.h> 

#include <unistd.h> 

#include <errno.h> 

int 
main (void) 
{ 

char * argv[] = { "Is", "-1", "-n", (char *) NULL }; 
execvp("ls", argv); 

fprintf (stderr, "Erreur %d\n" , errno); 
return 1; 

} 
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Lorsqu'on execute cette application, celle-ci recherche Is dans les repertoires de la variable 
d'environnement PATH. Ainsi, en modifiant cette variable pour eliminer le repertoire contenant 
1 s, execvp( ) echoue. 

$ echo $PATH 

/usr/bin:/bin:/usr/XHR6/bin:/usr/local/bin:/usr/sbin 
$ which Is 
/bin/Is 

$ ./exemple_execvp 

total 12 

-rwxrwxr-x 1 500 500 4607 Aug 

-rw-rw-r-- 1 500 500 351 Aug 

-rwxrwxr-x 1 500 500 4487 Aug 

-rw-rw-r-- 1 500 500 229 Aug 

$ export PATH=/usr/bin 
$ . /exempl e_execvp 
Erreur 2 

$ export PATH=$ PATH: /bin 
$ ./exemple_execvp 

total 12 

-rwxrwxr-x 1 500 500 4607 Aug 

-rw-rw-r-- 1 500 500 351 Aug 

-rwxrwxr-x 1 500 500 4487 Aug 

-rw-rw-r-- 1 500 500 229 Aug 



7 14:53 exempl e_execve 

7 14:51 exempl e_execve.c 

7 15:20 exempl e_execvp 

7 15:20 exempl e_execvp.c 



7 14:53 exempl e_execve 

7 14:51 exempl e_execve.c 

7 15:20 exempl e_execvp 

7 15:20 exempl e_execvp.c 



La fonction execlpO permet de lancer une application qui sera recherchee dans les reper- 
toires mentionnes dans la variable d'environnement PATH, en fournissant les arguments sous la 
forme d'une liste variable terminee par un pointeur NULL. Le prototype de execlpO est le 
suivant : 

| int execlp (const char * application, const char * arg, ...); 

Cette presentation est plus facile a utiliser que execvp( ) lorsqu'on a un nombre precis d'argu- 
ments connus a l'avance. Si les arguments a transmettre sont definis dynamiquement durant le 
deroulement du programme, il est plus simple d'utiliser un tableau comme avec execvp( ). 

Voici un exemple de programme qui se rappelle lui-meme en incrementant un compteur 
transmis en argument. II utilise argv[0] pour connaitre son nom ; l'argument argv[l] contient 
alors le compteur qu'on incremente jusqu'a 5 au maximum avant de relancer le meme 
programme. 

exemple_execlp.c 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 



int 

main (int argc, char * argv []) 

{ 

char compteur[2]; 
int i ; 
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i = 0; 

if (argc == 2) 

sscanf(argv[l], "%d" , & i); 

if (i < 5) { 
i ++; 

sprintf (compteur, "&d", i); 

fprintf (stdout, "execlpUs, %s, %s, NULL)\n", 
argv[0], argv[0], compteur); 
execl p(argv[0] , argv[0], compteur, (char *) NULL); 

} 

return 0; 



$ ./exemple_execlp 

execl p( ./exemple_execlp, ./exemple_execlp, 1, NULL) 
execl p( ./exemple_execlp, ./exemple_execlp, 2, NULL) 
execl p( ./exemple_execlp, ./exemple_execlp, 3, NULL) 
execl p( ./exemple_execlp, . /exemple_execlp, 4, NULL) 
execl p( ./exemple_execlp, . /exemple_execlp, 5, NULL) 
$ 

La fonction execl ( ) est identique a execl p( ), mais il faut indiquer le chemin d'acces complet, 
sans recherche dans PATH. La fonction execl e( ) utilise le prototype suivant : 

int execle(const char * app, const char * arg const char * envp []); 

dans lequel on fournit un tableau explicite pour Fenvironnement desire, comme avec execve( ). 
Recapitulons les caracteristiques des six fonctions de la famille exec( ). 

• execvO 

- tableau argv[] pour les arguments 

- variable externe globale pour l'environnement 

- nom d' application avec chemin d'acces complet 

• execveO 

- tableau argv[] pour les arguments 

- tableau envp[] pour l'environnement 

- nom d' application avec chemin d'acces complet 

• execvpO 

- tableau argv[] pour les arguments 

- variable externe globale pour l'environnement 

- application recherchee suivant le contenu de la variable PATH 

• execl 0 

- liste d' arguments a rgO , argl NULL 

- variable externe globale pour l'environnement 

- nom d' application avec chemin d'acces complet 
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• execleO 

- liste d' arguments a rgO, argl NULL 

- tableau envp[] pour 1'environnement 

- nom d' application avec chemin d'acces complet 

• execlpO 

- liste d' arguments a rgO, argl NULL 

- variable externe globale pour 1'environnement 

- application recherchee suivant le contenu de la variable PATH 

Lorsqu'un processus execute un appel exec( ) et que celui-ci reussit, le nouveau programme 
remplace totalement Fancien. Les segments de donnees, de code, de pile sont reinitialises. En 
consequence, les variables allouees en memoire sont automatiquement liberees. Les chaines 
d'environnement et d' argument sont copiees ; on peut done utiliser n'importe quel genre de 
variables (statiques ou allouees dynamiquement, locales ou globales) pour transmettre les 
arguments de 1' appel exec( ). 

L' ancien programme transmet automatiquement au nouveau programme : 

• Les PID et PPID, PGID et SID. II n'y a done pas de creation de nouveau processus. 

• Les identifiants UID et GID, sauf si le nouveau programme est Set-UID ou Set-GID. Dans 
ce cas, seuls les UID ou GID reels sont conserves, les identifiants effectifs etant mis a jour. 

• Le masque des signaux bloques, et les signaux en attente. 

• La liste des signaux ignores. Un signal ayant un gestionnaire installe reprend son compor- 
tement par defaut. Nous discuterons de ce point dans le chapitre 7. 

• Les descripteurs de fichiers ouverts ainsi que leurs eventuels verrous, sauf si le fichier 
dispose de l'attribut close-on-exec ; dans ce cas, il est referme. 

En revanche : 

• Les temps d'execution associes au processus ne sont pas remis a zero. 

• Les privileges du nouveau programme derivent des precedents comme nous l'avons decrit 
dans le chapitre 2. 

Causes d'echec de lancement d'un programme 

Nous avons dit que lorsque 1' appel exec( ) reussit, il ne revient pas. Lorsque le programme 
lance se finit par exitO, abortO ou return depuis la fonction mainO, le processus est 
termine. Par consequent, lorsque exec( ) revient dans le processus appelant, une erreur s'est 
produite. II est important d' analyser alors le contenu de la variable globale errno afin d'expli- 
quer le probleme a l'utilisateur. Le detail en est fourni dans la page de manuel de F appel 
exec( ) considere. Voyons les types d'erreurs pouvant se produire : 

• Le fichier n'existe pas, n'est pas executable, le processus appelant n'a pas les autorisations 
necessaires, ou l'interpreteur requis n'est pas accessible : EACCES, EPERM, ENOEXEC, ENOENT, 
ENOTDIR, EINVAL, EISDIR, ELIBBAD, ENAMETOOLONG, ELOOP. Le programme doit alors detailler 
l'erreur avant de proposer a l'utilisateur une nouvelle tentative d'execution. 

• Le fichier est trop gros, la memoire manque, ou un probleme d'ouverture de fichier se pose : 
E2BIG, ENOMEM, EIO, ENFILE, EMFILE. On peut considerer cela comme une erreur critique, oil 
le programme doit s'arreter, apres avoir explique le probleme a l'utilisateur. 
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• Un pointeur est invalide : EFAULT. II s'agit d'un bogue de programmation. 

• Le fichier est deja ouvert en ecriture : ETXTBSY. 

Pour pouvoir detailler un peu cette derniere erreur, nous devons nous interesser a la methode 
employee par Linux pour gerer la memoire virtuelle. 

L'espace memoire dont dispose un processus est decoupe en pages. Ces pages mesurent 
4 Ko sur les systemes a base de 80x86, mais varient suivant les architectures des machines. 
Leur dimension est definie dans <asm/param.h>. Les processus ont l'impression d'avoir un 
espace d'adressage lineaire et continu, mais en realite le noyau peut deplacer les pages a son 
gre dans la memoire physique du systeme. Une collaboration entre le noyau et le proces- 
seurpermet d'assurer automatiquement la traduction d'adresse necessaire lors d'un acces 
memoire. 

Une page peut egalement ne pas se trouver en memoire, mais resider sur le disque. Lorsque le 
processus tente d'y acceder, le processeur declenche une faute de page et le noyau charge a ce 
moment la page desiree. Cela permet d'economiser la memoire physique vraiment dispo- 
nible. 

Parallelement, lorsque le noyau a besoin de trouver de la place en memoire, il elimine une ou 
plusieurs pages qui ont peu de chances d'etre utilisees dans un avenir proche. Si la page a 
supprimer a ete modifiee par le processus, il est necessaire de la sauvegarder sur le disque. Le 
noyau utilise alors la zone de swap. Si, au contraire, la page n'a pas ete changee depuis son 
premier chargement sur le disque, on peut l'eliminer sans probleme, le noyau sait oil la 
retrouver. 

Nous decouvrons la une grande force de cette gestion memoire : le code executable d'un 
programme, n'etant jamais modifie par le processus, n'a pas besoin d'etre charge entierement 
en permanence. Le noyau peut relire sur le disque les pages de code necessaires au fur et a 
mesure de l'execution du programme. II faut done s'assurer qu'aucun autre processus ne 
risque de modifier le fichier executable. Pour cela, le noyau le verrouille, et toute tentative 
d'ouverture en ecriture d'un fichier en cours d'execution se soldera par un echec. 

Un scenario classique pour un developpeur met en avant ce phenomene : on utilise simultane- 
ment plusieurs consoles virtuelles ou plusieurs Xterm, en repartissant l'editeur de texte sur 
une fenetre, le compilateur sur une seconde, et le lancement du programme en cours de travail 
sur la troisieme. Cela permet de relancer la compilation en utilisant simplement la touche de 
rappel de l'historique du shell, et de redemarrer le programme developpe de la meme maniere 
dans une autre fenetre. On apporte une modification au programme, et on oublie de le quitter 
avant de relancer la compilation. Le compilateur echouera alors en indiquant qu'il ne peut pas 
ecrire sur un fichier executable en cours d' utilisation. 

De la meme facon, il n'est pas possible de lancer un programme dont le fichier est deja ouvert 
en ecriture par un autre processus. Dans ce cas, l'erreur ETXTBSY se produit. II est bon dans ce 
cas de prevenir Futilisateur. Le message peut meme lui indiquer de se reporter a la commande 
f user pour savoir quel processus a ouvert le fichier en question. 

Nous allons mettre en lumiere ce principe dans le programme suivant, exempl e_execv, qui 
tente - vainement- d'ouvrir en ecriture son propre fichier executable. II ouvre ensuite en 
mode d'ajout en fin de fichier exempl e_execvp que nous avons cree plus haut. Le fait d'ouvrir 
ce fichier en mode d'ajout evite de detruire les informations qu'il contient. II tente alors de 
l'executer. 
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exemple_execv.c : 

#include <fcntl .h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <errno.h> 

int 

main (int argc, char * argv[]) 
{ 

int fd; 

char * nv_argv[] = { "./exemple_execvp", (char *) NULL }; 

fprintf (stdout, "Essai d'ouverture de %s ... ", argv[0]); 

if ((fd = open(argv[0], 0_WR0NLY | 0_APPEND) ) < 0) { 
if (errno != ETXTBSY) { 

fprintf (stdout, "impossible, errno %d\n", errno); 
exit(l) ; 

} 

fprintf (stdout, "echec ETXTBSY, fichier deja utilise \n"); 

} 

fprintf (stdout, "Ouverture de exemple_execvp en ecriture ... "); 

if ((fd = open("exemple_execvp", 0_WR0NLY | 0_APPEND)) < 0) { 
fprintf (stdout, "impossible, errno %d\n", errno); 
exit(l) ; 

} 

fprintf (stdout, "ok \n Tentative d'executer exemple_execvp ... "); 
execvt " ./exempl e_execvp" , nv_argv) ; 

if (errno == ETXTBSY) 

fprintf (stdout, "echec ETXTBSY fichier deja utilise \n"); 

else 

fprintf (stdout, "errno = M\n", errno); 
return 1; 

} 

Comme on pouvait s'y attendre, le programme n'arrive pas a ouvrir en ecriture un fichier en 
cours d' execution ni a lancer un programme dont le fichier est ouvert. 

$ Is 

exempl e_execl p exempl e_execv exempl e_execve exempl e_execvp 

exempl e_execl p. c exempl e_execv.c exempl e_execve.c exempl e_execvp.c 
$ . /exempl e_execv 

Essai d'ouverture . /exempl e_execv ... echec ETXTBSY, fichier deja utilise 
Ouverture de exempl e_execvp en ecriture ... ok 

Tentative d'executer exempl e_execvp ... echec ETXTBSY fichier deja utilise 
$ 
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Fonctions simplifies pour executer un sous-programme 

II y a de nombreux cas ou on desire lancer une commande externe au programme, sans pour 
autant remplacer le processus en cours. On peut par exemple avoir une application principale 
qui lance des sous-programmes independants, ou desirer faire appel a une commande systeme. 
Dans ce dernier cas, on peut classiquement invoquer la commande mai 1 pour transmettre un 
message a Futilisateur, a Fadministrateur, ou envoyer un rapport de bogue au concepteur du 
programme. 

Pour cela, nous disposons de la fonction system ( ) et de la paire popen( ) / pel ose( ), qui sont 
implementees dans la bibliotheque C en invoquant fork( ) et exec( ) selon les besoins. 

La fonction systemO est declaree ainsi dans <stdlib.h> : 

int system (const char * commande); 

Cette fonction invoque le shell en lui transmettant la commande fournie, puis revient apres 
la fin de 1' execution. Pour ce faire, il faut executer un forkO, puis le processus lance la 
commande en appelant le shell « /bin /sh -c commande », tandis que le processus pere attend 
la fin de son fils. Si Finvocation du shell echoue, system( ) renvoie 127. Si une autre erreur se 
produit, elle renvoie -1, sinon elle renvoie la valeur de retour de la commande executee. Une 
maniere simplifiee d'implementer system( ) pourrait etre la suivante : 

int 

notre_system (const char * commande) 
{ 

char * argv[4] ; 
int retour; 
pid_t pid; 

if ((pid = forkO) < 0) 
/* erreur dans fork */ 
return -1; 

if (pid == 0) { 

/* processus fils */ 
argv[0] = "sh"; 
argv[l] = "-c"; 
argv[2] = commande; 
argv[3] = (char *) NULL; 
execv("/bin/sh", argv); 
/* execv a echoue */ 
exit(127); 

1 

/* processus pere */ 

/* attente de la fin du processus fils */ 
while (waitpidtpid, & retour, 0) < 0) 
if (errno != EINTR) 
return -1; 
return retour; 

} 
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Attention 

La fonction system( ) represente une enorme faille de securite dans toute application installee Set-UID. 
Voyons le programme simple suivant : 



exemple_system.c : 

#include <stdio.h> 
#include <stdlib.h> 

int 
main (void) 

{ 

system( "1 s" ) ; 
return 0; 

} 

Le programme ne fait que demander au shell d'executer "Is". Pourtant, si on l'installe Set- 
UID root, il s'agit d'une faille de securite. En effet, lorsque le shell recherche la commande 
"Is", il parcourt les repertoires mentionnes dans la variable d'environnement PATH. Celle-ci 
est heritee du processus pere et peut done etre configuree par Futilisateur pour inclure en 
premier le repertoire Le shell executera alors de preference la commande "Is" qui se 
trouve dans le repertoire en cours. II suffit que l'utilisateur cree un shell script executable, et 
le tour est joue. Voyons un exemple, en creant le shell script suivant : 

Is: 

#! /bin/sh 

echo faux Is 

echo qui lance un shell 

sh 

Examinons F execution suivante : 
$ ./exemple_system 

exemple_execlp exempl e_execv.c exempl e_execvp exemple_system.c 

exemple_execlp.c exempl e_execve exempl e_execvp.c Is 

exempl e_execv exempl e_execve.c exempl e_system 

$ export PATH=.:$PATH 

$ . /exempl e_system 

faux Is 

qui lance un shell 

$ exit 

$ 

Tout d'abord, le programme s'execute normalement et invoque « sh -c Is », qui trouve 1 s 
dans le repertoire /bin comme d'habitude. Ensuite, nous modifions notre PATH pour y placer 
en premiere position le repertoire en cours. A ce moment, le shell executera notre "1 s" piege 
qui lance un shell. Jusque-la, rien d'inquietant. Mais imaginons maintenant que le programme 
soit Set-UID root. C'est ce que nous configurons avant de revenir en utilisateur normal. 

$ su 

Password: 

# chown root. root exempl e_system 
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§ chmod +s exempt e_system 
§ exit 

A ce moment, F execution du programme lance le "Is" piege avec l'identite de root ! 

$ . /exempt e_sy stem 

faux Is 

qui lance un shell 

Comme nous avons inclus dans notre script une invocation de shell, nous nous retrouvons 
avec un shell connecte sous root ! II ne faut pas s'imaginer que le fait de forcer la variable 
d'environnement PATH dans le programme aurait resolu le probleme. D'autres failles de secu- 
rite classiques existent, notamment en faussant la variable d'environnement I FS qui permet au 
shell de separer ses arguments (normalement des espaces, des tabulations, etc.). 

II ne faut done jamais employer la fonction systeirK ) dans un programme Set-UID (ou Set- 
GID). On peut utiliser a la place les fonctions exec( ) , qui ne parcourent pas les repertoires du 
PATH. Le vrai danger avec system( ) est qu'il appelle le shell au lieu de lancer la commande 
directement. 

La veritable version de systemO, presente dans la GlibC, est legerement plus complexe 
puisqu'elle gere les signaux SIGINT et SIGQUIT (en les ignorant) et SIGCHLD (en le bloquant). 

En theorie, le fait de transmettre une commande NULL sert a verifier la presence du shell /bin/ 
sh. Normalement, system( ) doit renvoyer une valeur non nulle s'il est bien la. En pratique, 
sous Linux, la verification n'a pas lieu, GlibC considere que /bin/sh appartient au minimum 
vital d'un systeme Unix. 

Apres avoir bien compris que la fonction systemO ne doit jamais etre employee dans un 
programme Set-UID ou Set-GID, rien n'empeche de l'utiliser dans des applications simples 
ne necessitant pas de privileges. Lexemple que nous invoquions precedemment concernant 
l'appel de Futilitaire mail est pourtant difficile a utiliser avec la fonction systemO, car il 
faudrait d'abord creer un fichier contenant le message, puis lancer mai 1 avec une redirection 
d'entree. 

Pour cela, il est plus pratique d'utiliser la fonction popenO, qui permet de lancer un 
programme a la maniere de system( ) , mais en fournissant un des flux d'entree ou de sortie 
standard pour dialoguer avec le programme appelant. 

Le prototype de cette fonction, dans <stdi o . h> , est le suivant : 

FILE * popen (const char * commande, const char * mode); 

La commande est executee comme avec systemO en invoquant forkO et execO, mais, de 
plus, le flux d'entree ou de sortie standard de la commande est renvoye au processus appelant. 
La chaine de caracteres mode doit contenir soit r (read), si on souhaite lire les donnees de la 
sortie standard de la commande dans le flux renvoye, w (write) si on prefere ecrire sur son 
entree standard. Le flux renvoye par la fonction popen ( ) est tout a fait compatible avec les 
fonctions d' entree-sortie classiques telles fprintfO, fscanfO, freadO ou fwriteO. Par 
contre, le flux doit toujours etre referme en utilisant la fonction pcloseO a la place de 
fcl ose( ). 

Lorsqu'on appelle pel ose( ), cette fonction attend que le processus executant la commande se 
termine, puis renvoie son code de retour. 
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Voici un exemple simple dans lequel nous avons execute la commande "mai 1 ", suivie de notre 
nom d'utilisateur obtenu avec getl ogi n( ). La commande est executee en redirigeant son flux 
d'entree standard. Nous pouvons done ecrire notre message tranquillement par une serie de 
fprintfO. 

exemple_popen_1.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <string.h> 

#include <unistd.h> 

#include <errno.h> 

int 
main (void) 

{ 

FILE * message; 
char * commande; 

if ((commande = mal loc(strlen(getl ogin( ) ) + 6)) == NULL) { 
fprintf (stderr, "Erreur malloc %d\r\" , errno); 
exit(l) ; 

} 

strcpy(commande, "mail "); 
strcat(commande, getloginO); 

if ((message = popentcommande, "w")) == NULL) { 
fprintf (stderr, " Erreur popen %d \n", errno); 
exit(l) ; 

} 

fprintf (message, "Ceci est un message \n"); 
fprintf (message, "emis par moi -meme\n" ) ; 

pel ose(message) ; 

return 0; 

} 

Lorsqu'il est lance, ce programme emet bien le mail prevu. On notera que popen ( ) effectue, 
comme system( ) , un exeel ( ) de /bin/sh -c commande. Cette fonction est done recherchee 
dans les repertoires mentionnes dans le PATH. 

Une autre application classique de popenO, utilisant l'entree standard de la commande 
executee, est d'invoquer le programme indique dans la variable d'environnement PAGER, ou si 
elle n'existe pas, 1 ess ou more. Ces utilitaires affichent les donnees qu'on leur envoie page par 
page, en s'occupant de gerer la taille de l'ecran (less permet meme de revenir en arriere). 
C'est un moyen simple et elegant de fournir beaucoup de texte a Futilisateur en lui laissant la 
possibilite de le consulter a sa guise. 

Notre second exemple va lire la sortie standard de la commande executee. C'est une methode 
generalement utilisee pour recuperer les resultats d'une application complementaire ou pour 
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invoquer une commande systeme qui fournit des donnees difficiles a obtenir directement (who, 
ps, last, netstat...)- 

Nous allons ici invoquer la commande ifconfig en lui demandant Fetat de Finterface reseau 
ethO. Si celle-ci est activee, ifconfig renvoie une sortie du genre : 

ethO Lien encap:Ethernet HWaddr 00 : 50 : 04 : 8C : 7A: ED 

inet adr:172.16.15.16 Beast : 172 . 16 . 255 . 255 Masque:255.255.0.0 

UP BROADCAST RUNNING MULTICAST MTU:1500 Metricil 

Paquets Regus:0 erreurs:0 jetes:0 debordements:7395 trames:0 

Paquets transmis:29667 erreurs:0 jetes:0 debordements:0 carrier:22185 

col 1 i si ons : 7395 lg file transmission:100 

Interruption^ Adresse de base:0x200 

Si ethO est desactivee, on obtient : 

ethO Lien encap:Ethernet HWaddr 00 : 50 : 04 : 8C : 7A: ED 

inet adr:172.16.15.16 Beast : 172 . 16 . 255 . 255 Masque:255.255.0.0 
BROADCAST MULTICAST MTU: 1500 Metricil 

Paquets Recus:0 erreurs:0 jetes:0 debordements: 11730 trames:0 
Paquets transmi s :47058 erreurs:0 jetes:0 debordements :0 carrier:35190 
col 1 i si ons : 11730 lg file transmission:100 
Interruption^ Adresse de base:0x200 

(Remarquez la difference dans la troisieme ligne, UP dans un cas, et pas dans F autre.) Si 
1' interface n'existe pas, i f conf i g ne renvoie rien sur sa sortie standard, mais ecrit un message : 

ethO: erreur lors de la recherche d'infos sur 1 'interface: Peripherique non trouve 

sur sa sortie d' erreur. 

Notre programme va done lancer la commande et rechercher si une ligne de la sortie standard 
commence par UP. Si e'est le cas, il indique que Finterface est active. S'il ne trouve pas cette 
chaine de caracteres ou si la commande ne renvoie aucune donnee sur sa sortie standard, il 
considere Finterface comme etant inactive. 

exemple_popen_2.c : 

#include <stdio.h> 
//include <stdlib.h> 
//include <string.h> 
//include <unistd.h> 
//include <errno.h> 

int 
main (void) 
{ 

FILE * sortie; 
char ligne [128]; 
char etat [128]; 

if ((sortie = popen("/sbin/ifconfig ethO", "r")) == NULL) ( 
fprintf (stderr, " Erreur popen %d \n", errno); 
exit(l) ; 

} 
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while (fgetsdigne, 127, sortie) != NULL) { 
if (sscanf (ligne, "%s", etat) == 1) 
if (strcmptetat, "UP") == 0) { 

fprintf (stderr, "interface ethO en marche \n"); 
pel ose(sortie) ; 
return 0; 

} 

} 

fprintf (stdout, "interface ethO inactive \n"); 
pel ose(sortie) ; 
return 0; 

} 

Cet exemple (un peu artificiel, convenons-en) montre quand meme l'utilite d'invoquer une 
commande systeme et d'en recuperer aisement les informations. Encore une fois, insistons 
sur le manque de securite qu'offre popen( ) pour un programme susceptible d'etre installe Set- 
UID ou Set-GID. 

Un dernier exemple concernant popen ( ) nous permet d'invoquer un script associe a l'applica- 
tion principale. Ce script est ecrit en langage Tcl/Tk, et offre une boite de saisie configurable. 
II utilise les chaines de caracteres transmises en argument en ligne de commande : 

• Le premier argument correspond au nom de la boite de saisie (le titre de la fenetre). 

• Le second argument est le libelle affiche pour questionner l'utilisateur. 

• Le troisieme argument (eventuel) est la valeur par defaut pour la zone de saisie. 
En invoquant ainsi ce script dans un Xterm : 

$ ./exemple_popen_3.tk Approximation "Entrez le degre du polynome pour 

1 'approximation des trajectoi res" 3 

La fenetre suivante apparait : 



Figure 4.1 

Fenetre de saisie en Tcl/Tk 



Approximation 


- □ x 


Entrez le degre du polynome pour ('approximation des trajectoires 


r 


Ok /Annuler 







Lorsqu'on appuie sur le bouton Ok, la valeur saisie est affichee sur la sortie standard. 
Le script Tcl/Tk est volontairement simplifie ; il ne traite aucun cas d'erreur. 

exemple_popen_3.tk : 

#! /usr/bin/wish 

## Le titre de la fenfitre est le premier argument recu 
# sur la ligne de commande. 
wm title . [lindex $argv 0] 
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## Le haut de la boite de dialogue contient un li belle 

# fourni en second argument de la ligne de commande, et 
## une zone de saisie dont le contenu par defaut est 

# eventuellement fourni en troisieme argument, 
frame .haut -relief flat -borderwidth 2 

label .libelle -text [lindex $argv 1] 

entry .saisie -relief sunken -borderwidth 2 

.saisie insert 0 [lindex $argv 2] 

pack .libelle .saisie -in .haut -expand true -fill x 

## Le bas contient deux boutons, Ok et Annul er, chacun avec 

## sa procedure associee. 

frame .bts -relief sunken -borderwidth 2 

button .ok -text "Ok" -command bouton_ok 

button .annuler -text "Annuler" -command bouton_annul er 

pack .ok .annuler -side left -expand true -pady 3 -in .bts 

pack .haut .bts 

update 

proc bouton_ok {} { 

## La procedure associee a OK transmet la chaine lue 
## sur la sortie standard, 
puts [.saisie get] 
exit 0 

} 

proc bouton_annul er {} { 

# Si on annule, on n'ecrit rien sur la sortie standard. 

# On quitte s implement, 
exit 0 

} 

Notre programme C va invoquer le script et traiter quelques cas d'echec, notamment en 
testant le code de retour de pel ose( ). Si une erreur se produit, on effectue la saisie a partir de 
1' entree standard du processus. Ceci permet d'utiliser le meme programme dans un environ- 
nement X-Window avec une boite de dialogue ou sur une console texte avec une saisie 
classique. 

La ligne de commande que popen( ) invoque est la suivante : 

./exemple_popen_3.tk Saisie "Entrez votre nom" nom_login 2> /dev/null 
dans laquelle nom_login est obtenu par la commande getl ogi n ( ) . 

On redirige la sortie d' erreur standard vers /dev/null afin d'eviter les eventuels messages 
d'erreur de Tk si on se trouve sur une console texte (on suppose que le shell /bin/sh utilise 
par popen( ) est du type Bourne, ce qui est normalement le cas sous Linux). La chaine "Entrez 
votre nom" est encadree par des guillemets pour qu'elle ne constitue qu'un seul argument de 
la ligne de commande. 
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Voici le programme C qui invoque le script decrit precedemment : 

exemple_popen 3.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 

int 
main (void) 

{ 

FILE * saisie; 
char * login ; 
char nom [128]; 
char commande [128]; 

if ((login = getloginO) == NULL) 
strcpy(nom, "\"\ n ") ; 

else 

strcpy(nom, login) ; 
sprintf (commande, "./exemple_popen_3.tk " 
"Saisie " 

"\"Entrez votre nom\" " 
"%s 2>/dev/null", nom); 

if ((saisie = popen(commande , "r")) == NULL) { 
/* Le script est, par exemple, introuvable */ 
/* On va essayer de lire sur stdin. */ 
fprintf (stdout, "Entrez votre nom : "); 
if (fscanf (stdin, "%s" , nom) != 1) { 

/* La lecture sur stdin echoue... */ 

/* On utilise une valeur par defaut. */ 

strcpy(nom, getloginO); 

} 

fprintf (stdout, "Nom saisi : £s\n", nom); 
return 0; 

} 

if (fscanf (saisie, "%s", nom) != 1) ( 
if (pclose(saisie) != 0) { 

/* Le script a echoue pour une raison quelconque. */ 
/* On recommence la saisie sur stdin. */ 
fprintf (stdout, "Entrez votre nom : "); 
if (fscanf (stdin, "%s" , nom) != 1) { 

/* La lecture sur stdin echoue... */ 
/* On utilise une valeur par defaut. */ 
strcpy (nom, getloginO); 

} 

} else { 

/* L'utilisateur a clique sur Annuler. II faut */ 
/* abandonner 1 'operation en cours. */ 
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fprintf (stdout, "Pas de nom fourni - abandon\n"); 
return 1; 

} 

} else { 

pclose(saisie); 

} 

fprintf (stdout, "Nom saisi : £s\n", nom); 
return 0; 

} 

Conclusion 

Ce chapitre nous a peimis de decouvrir plusieurs methodes pour lancer une application. Les 
mecanismes a base de exec( ) permettent de remplacer totalement le programme en cours par 
un autre qui est executable, tandis que les fonctions systemO et popen( )-pcl ose( ) servent 
plutot a utiliser une autre application comme sous-programme de la premiere. 
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Dans ce chapitre, nous allons etudier tout d'abord les moyens de mettre fin a l'execution d'un 
programme. Nous verrons ensuite des methodes permettant d'enregistrer des routines qui 
seront automatiquement executees avant de quitter 1' application. 

Nous nous pencherons sur l'attente de la fin d'un processus fils et la recuperation de son etat 
de terminaison, puis nous examinerons les moyens de signaler une erreur a l'utilisateur, 
meme si celle-ci ne conduit pas necessairement a 1' arret du programme. 

Terminaison d'un programme 

Un processus peut se terminer normalement ou anormalement. Dans le premier cas, 1' appli- 
cation est abandonnee a la demande de l'utilisateur, ou la tache a accomplir est finie. Dans le 
second cas, un dysfonctionnement est decouvert, qui est si serieux qu'il ne permet pas au 
programme de continuer son travail. Le processus est alors tue par le noyau par l'interme- 
diaire d'un signal fatal. 

Terminaison normale d'un processus 

Un programme peut se finir de plusieurs manieres. La plus simple est de revenir de la fonction 
main( ) en renvoyant un compte rendu d'execution sous forme de valeur entiere. Cette valeur 
est lue par le processus pere, qui peut en tirer les consequences adequates. Par convention, un 
programme qui reussit a effectuer son travail renvoie une valeur nulle, tandis que les cas 
d'echec sont indiques par des codes de retour non nuls (et qui peuvent etre documented avec 
F application). Cela permet d'ecrire des scripts shell robustes, qui verifient le bon fonctionne- 
ment de chaque commande employee. Dans la plupart des cas, on ne teste que la nullite du 
code de retour. Lorsque le processus est arrete a cause d'un signal, le shell modifie le code de 
retour (bash ajoute 128, par exemple). II est done conseille de n'utiliser que des valeurs 
comprises entre 0 et 127. 
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Lorsqu'un processus lance par le shell se termine, son code de retour est disponible dans la 
variable speciale $?. Suivant les applications, ce code aura differentes significations. Prenons 
par exemple Futilitaire grep. Nous allons Finvoquer de maniere a ce qu'il cherche - et trouve 
- la chaine de caracteres root dans le fichier /etc/passwd. 

$ grep root /etc/passwd 

root:x:0:0:root:/root: /bin /bash 

operator :x: 11 :0:operator: /root :/sbin/nologin 

$ echo $? 

0 

$ 

Le code de retour est nul, indiquant la reussite. A present, donnons lui a chercher une chaine 
ne se trouvant pas dans le fichier : 

$ grep abcdefg /etc/passwd 
$ echo $? 

1 
$ 

La valeur 1 signifie done « j 'ai fait mon travail correctement, mais je n 'ai pas trouve la 
chaine ». Demandons-lui maintenant de consulter un fichier inexistant : 

$ grep root /etc/inexistant 

grep: /etc/inexistant: Aucun fichier ou repertoire de ce type 

$ echo $? 

2 

$ 

Le code de retour 2 a done une signification differente : « je n'aipas pufaire mon travail, la 
demande est invalide ». Tous ces codes (documented dans la page de manuel de grep), sont 
renvoyes par le processus quand il se termine normalement - de son plein gre. Toutefois, si le 
processus est interrompu prematurement et se termine anormalement, le shell renseigne la 
variable speciale $? en fonction du numero du signal ayant tue le processus. Par exemple, 
nous invoquons la commande si eep pour un sommeil de 30 secondes, et nous l'interrompons 
pendant ce temps en pressant Controle-C : 

$ sleep 30 

(Ctrl-C) 
$ echo $$ 

130 
$ 

La valeur 130 correspond a 128+2. Comme on le voit dans la page de manuel signal (7), ce 
numero est celui du signal SIGINT, correspondant a la pression de la touche d' interruption 
(Ctrl-C par defaut). 

Si seuls la reussite ou l'echec du programme importent (si le processus pere n'essaye pas de 
detailler les raisons de l'echec), il est possible d'employer les constantes symboliques EXIT_ 
SUCCESS ou EXIT_FAI LURE definies dans <stdl i b. h>. Ceci a l'avantage d'adapter automatique- 
ment le comportement du programme, meme sur les systemes non conformes a SUSv3, ou 
ces constantes ne sont pas necessairement 0 et 1 . 
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Une autre facon de terminer un programme normalement est d'utiliser la fonction exit( ). 
void exit (int code) ; 

On lui transmet en argument le code de retour pour le processus pere. L'effet est strictement 
egal a celui d'un retour depuis la fonction main( ), a la difference que exit( ) peut etre invo- 
quee depuis n'importe quelle partie du programme (notamment depuis les routines de traite- 
ment d'erreur). 

Lorsqu'on utilise uniquement une terminaison avec exitO dans un programme, le compi- 
lateur se plaint que la fin de la fonction mainO est atteinte alors qu'aucune valeur n'a ete 
renvoyee. 

exemple_exit_1.c : 

#include <stdlib.h> 

void sortie (void) ; 

int 
main (void) 

{ 

sortie( ) ; 

} 

void 
sortie(void) 

{ 

exit(EXIT_FAILURE); 

} 

declenche a la compilation Favertissement suivant : 

$ cc -Wall exemple_exit_l.c -o exemple_exit_l 

exemple_exit_l.c: In function "main": 

exemple_exit_l.c:9: warning: control reaches end of non-void function 
$ 

(Si nous avions directement mis exitO dans la fonction mainO, le compilateur Faurait 
reconnu et aurait supprime cet avertissement.) 

Pour eviter ce message, on peut etre tente de declarer main( ) comme une fonction de type 
void. Sous Linux, cela ne pose pas de probleme, mais un tel programme pourrait ne pas etre 
portable sur d'autres systemes qui exigent que mainO renvoie une valeur. D'ailleurs, le 
compilateur gcc avertit que ma i in C ) doit normalement etre de type int. 

exemple_exit 2.c : 

#include <stdlib.h> 

void 
main (void) 
{ 

exit(EXIT_SUCCESS); 

} 
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declenche un avertissement : 

$ cc -Wall exemple_exit_2.c -o exempl e_exit_2 
exemple_exit_2.c:5: warning: return type of "main' is not Mnt' 

Ayons done comme regie de bonne conduite - ou plutot de bonne lisibilite - de toujours 
declarer mainO comme etant de type int, et ajoutons systematiquement un return 0 ou 
return EXIT_SUCCESS a la fin de cette routine. C'est une bonne habitude a prendre, meme si 
nous sortons toujours du programme en invoquant exit( ). 

Lorsqu' un processus se termine normalement, en revenant de ma i n ( ) ou en invoquant ex i t ( ) , 
la bibliotheque C effectue les operations suivantes : 

• Elle appelle toutes les fonctions qui ont ete enregistrees a Faide des routines atexitO et 
on_exit( ) , que nous verrons dans laprochaine section. 

• Elle ferme tous les flux d' entree-sortie, en ecrivant effectivement toutes les donnees qui 
etaient en attente dans les buffers. 

• Elle supprime les fichiers crees par la fonction tmpf i 1 e ( ) . 

• Elle invoque l'appel-systeme _exit( ) qui terminera le processus. 

L'appel-systeme _exit() execute - pour ce qui concerne le programmeur applicatif- les 
taches suivantes : 

• II ferme les descripteurs de fichiers (transferant les donnees aux peripheriques). 

• Les processus his sont adoptes par le processus 1 (in it), qui lira leur code de retour des 
qu'ils se finiront pour eviter qu'ils ne restent a l'etat zombie de maniere prolongee. 

• Le processus pere recoit un signal SIGCHLD . 

• Selon certaines conditions et si le processus est leader de session, le signal SIGH UP peut etre 
envoye a tous les processus en avant-plan sur le terminal de la session. 

• Si le processus est leader de son groupe et s'il y a des processus stoppes dans celui-ci, tous 
les membres du groupe a present orphelins recoivent SIGHUP et SIGCONT. 

Le systeme se livre egalement a des taches de liberation des ressources verrouillees, de comp- 
tabilisation eventuelle des processus, etc. Le detail de ces operations n'est pas d'une grande 
importance pour une application classique, considerons simplement que l'execution du 
processus est terminee, et que ses ressources sont liberees. 

Le processus devient alors un zombie, e'est-a-dire qu'il attend que son processus pere lise son 
code de retour. Si le processus pere ignore explicitement SIGCHLD, le noyau effectue automati- 
quement cette lecture. Si le processus pere s'est deja termine, init adopte temporairement le 
zombie, juste le temps de lire son code de retour. Une fois cette lecture effectuee, le processus 
est elimine de la liste des taches sur le systeme. 

Le fait d'invoquer _exi t ( ) a la place de exi t ( ) peut etre utile dans certaines circonstances : 

• Lorsqu' on utilise un partage des fichiers entre le processus pere et le processus his, par 

exemple en employant cl one( ) a la place de f ork( ) , ou lors de 1' implementation d'une 

bibliotheque de threads. A ce moment-la, on evite de fermer les flux d' entree-sortie, car le 
processus pere peut encore avoir besoin de ces fichiers. Ce cas est assez rare dans des 
applications courantes. 
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• On peut enregistrer des routines pour qu'elles soient automatiquement executees lors de la 
sortie du programme par exi t( ) ou return ( ) depuis mai n( ). Ces fonctions servent genera- 
lement a faire du « menage » ou a signaler explicitement la fin d'une transaction sur une 
connexion reseau. Le fait d'appeler directement _exit() empechera l'execution de ces 
routines. 

Si on utilise _exi t ( ) , il ne faut pas oublier de fermer proprement tous les fichiers pour etre sur 
que les donnees temporairement en buffer soient ecrites entierement. De meme, les eventuels 
fichiers temporaires crees par tmpf i 1 e( ) ne sont pas detruits automatiquement. 

Terminaison anormale d'un processus 

Un programme peut egalement se terminer de maniere anormale. Ceci est le cas par exemple 
lorsqu'un processus execute une instruction illegale, ou qu'il essaye d'acceder au contenu 
d'un pointeur mal initialise. Ces actions declenchent un signal qui, par defaut, arrete le 
processus en creant un fichier d'image memoire core. Nous en parlerons plus longuement 
dans le prochain chapitre. 

Une maniere « propre » d'interrompre anormalement un programme (par exemple lorsqu'un 
bogue est decouvert) est d'invoquer la fonction abort( ). 

void abort (void) ; 

Celle-ci envoie immediatement au processus le signal SIGABRT, en le debloquant s'il le faut, et 
en retablissant le comportement par defaut si le signal est ignore. Nous verrons dans le 
prochain chapitre la maniere de traiter ce signal si on desire installer un gestionnaire pour 
effectuer quelques taches de nettoyage avant de finir le programme. 

Le probleme de la fonction abort( ) ou des arrets dus a des signaux est qu'il est difficile de 
determiner ensuite a quel endroit du programme le dysfonctionnement a eu lieu. II est 
possible d'autopsier le fichier core (a condition d' avoir inclus les informations de debogage 
lors de la compilation avec l'option -g de gcc), mais c'est une tache parfois ardue. Une autre 
maniere de detecter automatiquement les bogues est d'utiliser systematiquement la fonction 
assertO dans les parties critiques du programme. II s'agit d'une macro, definie dans 
<assert.h>, et qui evalue l'expression qu'on lui transmet en argument. Si l'expression est 
vraie, elle ne fait rien. Par contre, si elle est fausse, assertO arrete le programme apres avoir 
ecrit un message sur la sortie d'erreur standard, indiquant le fichier source concerne, la ligne 
de code et le texte de 1' assertion ayant echoue. II est alors tres facile de se reporter au point 
decrit pour rechercher le bogue. 

La macro assertO agit en surveillant perpetuellement que les conditions prevues pour 
l'execution du code soient respectees. Voici un exemple ou nous faisons volontairement 
echouer la seconde assertion. 

exemple_assert.c : 

#include <assert.h> 
#include <stdio.h> 
#include <stdlib.h> 

void fonction_reussissant (int i); 
void fonction_echouant (int i); 
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int 
main (void) 
{ 

fonction_reussissant(5) ; 
fonction_echouant(5) ; 

return EXIT_SUCCESS; 

} 

void 

fonction_reussissant (int i) 
{ 

/* Cette fonction necessite que i soit positif */ 
assertti >= 0) ; 

fprintf (stdout, "Ok, i est positif \n"); 

} 

void 

fonction_echouant (int i) 
{ 

/* Cette fonction necessite que i soit negatif */ 
assertti <= 0) ; 

fprintf (stdout, "Ok, i est negatif \n"); 

} 

Lors de l'execution, la premiere assertion passe, et le message est ecrit sur stdout, mais la 
seconde assertion echoue, et assert( ) affiche alors le detail du probleme sur stderr : 

$ . /exemple_«ssert 

Ok, i est positif 

exemple_assert: exemple_assert.c:31: fonction_echouant: 1 'assertion ~i <= 0' 

a echoue. 
Aborted (core dumped) 
$ 

Nous voyons alors le grand interet de assert () : elle nous indique le nom du programme 
executable, le fichier source concerne, le numero de la ligne, le nom de la fonction, et le texte 
integral de 1' assertion ayant engendre 1' arret. De plus, elle declenche la creation d'un fichier 
core pouvant servir a analyser plus en detail l'etat des donnees au moment de l'echec. 

Notre exemple est assez artificiel car nous avons utilise une macro assert( ) pour verifier des 
conditions qui auraient tres bien pu etre analysees par une structure if /else renvoyant un 
code d'erreur. En fait, assertO ne doit etre utilisee que pour des circonstances ne devant 
jamais se produire durant l'execution normale du programme. 

En effet, lorsque la phase de debogage est terminee, on supprime toutes les assertions en defi- 
nissant une constante symbolique speciale (NDEBUG) a la compilation. Cela permet de gagner 
en efficacite en eliminant tous ces tests qui sont dorenavant inutiles. 
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Attention 

assertt ) etant definie comme une macro qui evalue son argument, il faut eviter totalement tous les effets 
de bord dans I'expression transmise. On n'utilisera done jamais des formulations du genre : a s s e rt ( ++i < 5 ) 
ou assert((i = j) != 0) , car la partie assignation de ces expressions disparait lorsqu'on passe en 
code de production. 



II est bon d'utiliser systematiquement assertt ) pour verifier les arguments d'entree d'une 
routine lorsqu'ils doivent, dans tous les cas, se situer dans une plage de valeurs donnees (taille 

superieure a 0, pointeur non N U L I ). Ceci permet d'ailleurs de documenter automatiquement 

les contraintes sur les arguments attendus, une ligne : 

assert(ptr != NULL); 
etant aussi parlante et plus efficace qu'un commentaire 

/* On suppose que le pointeur n'est jamais NULL */ 
qui risque de ne pas etre mis a jour en cas de modification du code. 

On notera qu'il est possible de definir avec #define ou de supprimer avec #undef la constante 
NDEBUG dans le corps meme d'un module, en re-incluant <assert.h> a la suite. La macro 
assertO sera lors validee ou ignoree jusqu'a la prochaine modification. Ceci permet de 
n'activer le debogage que dans des portions restreintes du logiciel, ou au contraire d'exclure 
des fonctions qui ont ete totalement validees. 

Face a un test precis, il est parfois difficile de decider s'il faut l'incorporer dans une assertion 
ou dans une verification plus classique avec un message sur stderr. La regie est que le code 
definitif qui sera soumis a Futilisateur ne pourra en aucun cas faire echouer une assertion. La 
fonction assertO est un outil de debogage et pas une methode de sortie sur erreur. C'est 
pourquoi, si une demande d' allocation memoire echoue, la gestion d' erreur doit etre effectuee 
par le programme directement, car ici ce n'est pas un bogue mais un probleme de ressource 
indisponible temporairement. Cependant, une routine de traitement de chame de caracteres 
peut refuser systematiquement un pointeur NULL en entree. Dans ce cas, une assertion echouant 
permet de rechercher (a l'aide du fichier core cree) la routine appelante ayant transmis un 
mauvais argument. 

Lorsqu'on desire basculer en code definitif pour Futilisateur, on peut inclure a la compilation 
la constante NDEBUG sur la ligne de commande de gec : 

$ cc -Wall -DNDEBUG programme. c -o programme 

ou dans le corps du fichier C, avant 1' inclusion de<assert.h>: 

#define NDEBUG 
#include <assert.h> 

Cette derniere methode permet de faire basculer independamment en mode de developpement 
ou de production les divers modules du projet. 

Notons finalement que assert( ) est implementee dans la GlibC en appelant abort( ), ce qui 
signale une terminaison anormale du processus pere, comme nous en verrons le detail dans 
les routines wai t( ), wai tpid( ), etc. 
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Execution automatique de routines de terminaison 

II est possible, grace aux routines atexi t ( ) et on_exi t ( ) de faire enregistrer des fonctions qui 
seront automatiquement invoquees lorsque le processus se terminera normalement, c'est- 
a-dire par un retour de la fonction mai n ( ) ou par un appel de la fonction exi t ( ) . 

Ces routines peuvent etre utiles dans plusieurs cas : 

• effacer des fichiers temporaires ou au contraire enregistrer les preferences de l'utilisateur, 
ou Fhistorique des actions effectuees ; 

• enregistrer sur disque les structures d'une base de donnees maintenue en memoire ; 

• liberer les verrous sur les fichiers ou bases de donnees partages ; 

• signaler la fin du processus au demon de journalisation du systeme (sy s 1 og) ; 

• restaurer l'etat initial du terminal ; 

• terminer un dialogue reseau proprement en suivant un protocole complet, plutot que de 
simplement couper la connexion. . . 

II est toujours possible d'appeler explicitement ces routines avant de quitter 1' application, 
mais Favantage de ce mecanisme d'invocation automatique est double : 

• On peut quitter le programme depuis plusieurs endroits en appelant exit( ), ou revenir de 
la fonction mai n ( ) sans avoir a se soucier des routines de terminaison. Elles seront appelees 
systematiquement quel que soit le cas. 

• Lorsqu'on definit une bibliotheque de fonctions pouvant etre reutilisees dans plusieurs 
programmes, et que celle-ci necessite un traitement final avant la fin du processus (par 
exemple pour l'un des cas cites ci-dessus), il est plus sur d'enregistrer avec atexi t() la 
routine desiree plutot que de demander au programmeur qui utilisera la bibliotheque 
d'appeler une fonction finale. 

Le prototype de atexitO est declare dans <stdlib.h>, ainsi : 

int atexit (void * routine (void)); 
En d'autres termes, on doit lui transmettre un pointeur sur une routine de type : 

void routine_terminaison (void); 

Lorsqu'elle reussit, atexi t( ) renvoie 0. Sinon, elle renvoie une valeur non nulle. La norme C 
Ansi indique qu'on peut enregistrer au minimum 32 fonctions. La GlibC ne fixe pas de 
limites, en allouant dynamiquement les structures de donnees necessaires a la memorisation. 

Les fonctions memorisees avec atexi t() sont invoquees, en sortie, dans l'ordre inverse de 
leur enregistrement. Une fonction enregistree deux fois est invoquee deux fois. II n'y a pas de 
possibilite de « deprogrammer » une fonction memorisee. La meilleure solution pour desac- 
tiver une routine de terminaison est d'utiliser une variable globale que la routine consultera 
pour savoir si elle doit agir ou non. 

Lorsqu'on appelle la fonction exit( ) depuis l'interieur d'une routine de terminaison, elle n'a 
pas d'effet (en particulier, le programme ne boucle pas sur cette routine). Par contre, si on 
invoque l'appel-systeme _exit( ), la sortie est immediate, sans appeler les eventuelles autres 
routines de terminaison. Les routines de terminaison sont invoquees avant la fermeture syste- 
matique des fichiers ouverts et l'effacement des fichiers temporaires fournis par tmpfileO. 
II est done possible de les utiliser encore dans les routines de terminaison. 
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Voici un exemple d' utilisation de la fonction atexit( ). Nous appellerons trois routines, et la 
deuxieme sera enregistree deux fois. On voit egalement que l'appel-systeme exit( ) n'a pas 
d'effet lorsqu'il est appele depuis Finterieur d'une routine de terminaison. 

exemple_atexit.c : 

#include <stdio.h> 
#include <stdlib.h> 

void sortie_l (void) ; 
void sortie_2 (void) ; 
void sortie_3 (void) ; 

int 
main (void) 

{ 

if (atexit(sortie_3) ! = 0) 

fprintf (stderr, "Impossible d'enregistrer sortie_3( )\n") ; 
if (atexit(sortie_2) ! = 0) 

fprintf (stderr, "Impossible d'enregistrer sortie_2( )\n") ; 
if (atexit(sortie_2) ! = 0) 

fprintf (stderr, "Impossible d'enregistrer sortie_2( )\n") ; 
if (atexit(sortie_l) != 0) 

fprintf (stderr, "Impossible d'enregistrer sortie_l( )\n") ; 
fprintf (stdout, "Allez... on quitte en revenant de main( )\n" ) ; 
return EX IT_SUCCESS ; 

} 

void 
sortie_l (void) 
{ 

fprintf (stdout, "Sortie_l : appelle exit()\n"); 
exit(EXIT_SUCCESS); 

} 

void 
sortie_2 (void) 
{ 

fprintf (stdout, "Sortie_2\n" ) ; 

} 

void 
sortie_3 (void) 
{ 

fprintf (stdout, "Sortie_3\n" ) ; 

} 

L' execution a lieu ainsi : 
$ ./exemple_atexit 

Allez... on quitte en revenant de mainO 
Sortie_l : appelle exitO 
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Sortie_2 
Sortie_2 
Sortie_3 
$ 

Par contre, si on remplace exi t( ) par _exi t( ) dans sortie_l( ), on obtient : 
$ ./exemple_atexit 

Allez... on quitte en revenant de mainO 

Sortie_l : appel 1 e _exi t( ) 

$ 

II existe une seconde fonction permettant d'enregistrer des routines de terminaison : on_ 
exit( ). II s'agit d'une extension Gnu. La routine de terminaison recevra lors de son invoca- 
tion deux arguments : le premier est un entier correspondant au code transmis a exitOou 
return de main( ). Le second argument est un pointeur void *, et la valeur de cet argument est 
programmed lors de l'appel de on_exit( ). 

Le prototype de on_exi t ( ) est declare dans <stdl i b . h> , ainsi : 

int on_exit (void (* fonction) (int. void *), void * argument); 

Le second argument est souvent utilise pour passer un pointeur de fichier FILE * a terminer de 
traiter avant de finir. Voici un exemple oil la routine de terminaison ne fait que fermer le 
fichier transmis s'il est non NULL. Bien sur, elle pourrait effectuer une tache bien plus compli- 
quee, comme mettre a jour un en-tete ou une table des matieres en debut de fichier. 

exemple_on_exit.c : 

#include <stdio.h> 
#include <stdlib.h> 

void gestion_sortie (int code, void * pointeur); 

int 
main (void) 
{ 

FILE * fp; 

fp = fopen("exemple_atexit.c", "r"); 
if (on_exit(gestion_sortie, (void *) fp) != 0) 
fprintf (stderr, "Erreur dans on_exit \n"); 

fp = fopen("exemple_on_exit.c", "r"); 
if (on_exit(gestion_sortie, (void *) fp) != 0) 
fprintf (stderr, "Erreur dans on_exit \n"); 

if (on_exit(gestion_sortie, NULL) != 0) 

fprintf (stderr, "Erreur dans on_exit \n"); 

fprintf (stdout, "Allez... on quitte en revenant de main( )\n" ) ; 
return 4; 

} 
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void 

gestion_sortie (int code, void * pointeur) 
{ 

fprintf (stdout, "Gestion Sortie appelee... code M\n", code); 
if (pointeur == NULL) { 

fprintf (stdout, "Pas de fichier a fermer \n"); 
} else { 

fprintf (stdout, "Fermeture d'un fichier \n"); 
fclose((FILE *) pointeur); 



L' execution suivante nous montre que les fonctions sont appelees, comme pour atexitO, 
dans Fordre inverse de leur programmation (le pointeur NULL programme en dernier apparait 
en premier). Nous voyons egalement que le code de retour de mai n ( ), 4, est bien transmis a la 
routine de terminaison. 

$ ./exemple_on_exit 

Allez... on quitte en revenant de mainO 
Gestion Sortie appelee... code 4 
Pas de fichier a fermer 
Gestion Sortie appelee... code 4 
Fermeture d'un fichier 
Gestion Sortie appelee... code 4 
Fermeture d'un fichier 
$ 



Attendre la fin d'un processus fils 

L'une des notions fondamentales dans la conception des systemes Unix est la mise a disposi- 
tion de l'utilisateur d'un grand nombre de petits utilitaires tres specialises et tres configura- 
bles grace a des options en ligne de commande. Ces petits utilitaires peuvent etre associes, par 
des redirections d' entree-sortie, en commandes plus complexes, et regroupes dans des fichiers 
scripts simples a ecrire et a deboguer. 

II est primordial dans ces scripts de pouvoir determiner si une commande a reussi a effectuer 
son travail correctement ou non. On imagine done l'importance qui peut etre portee a la 
lecture du code de retour d'un processus. Cette importance est telle qu'un processus qui se 
termine passe automatiquement par un etat special, zombie 1 , en attendant que le processus 
pere ait lu son code de retour. Si le processus pere ne lit pas le code de retour de son fils, celui- 
ci peut rester indefiniment a l'etat zombie. Voici un exemple, dans lequel le processus fils 
attend deux secondes avant de se terminer, tandis que le processus pere affiche regulierement 
l'etat de son fils en invoquant la commande ps. 

exemple_zombie_1.c : 

#include <stdio.h> 
find tide <stdlib.h> 
#include <unistd.h> 



1. Les diffeients etats d'un processus seront detailles dans le chapitre 11 consacre aux mecanismes d'ordonnancement 
disponibles sous Linux. 
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i nt 
main (void) 

{ 

pid_t pid; 

char commande[128] ; 

if ((pid = forkO) < 0) { 

fprintf (stderr, "echec fork()\n"); 
exi t( EXIT_FAI LURE) ; 

} 

if (pid == 0) { 

/* processus f 11 s */ 
sleep(2); 

fprintf (stdout, "Le processus fils %ld se tertnine \n", 
(long) getpidO); 

exit(EXIT_SUCCESS) ; 
) else { 

/* processus pere */ 

snprintf (commande, 128, "ps %ld", (long) pid); 

system(commande) ; 

sleep(l) ; 

system(commande) ; 

sleep(l) ; 

system(commande) ; 

sleep(l) ; 

system(commande) ; 

sleep(l); 

system(commande) ; 

sleep(l) ; 

system(commande) ; 

} 

return EXIT_SUCCESS; 

} 

Le "S" en deuxieme colonne indique que le processus fils est endormi au debut, puis il se 
termine et passe a l'etat zombie "Z" : 

$ ./exemple_zombie_l 



PID TTY 


STAT 


TIME 


COMMAND 


949 pts/0 


S 


0:00 


. /exempl e_zombi e_l 


PID TTY 


STAT 


TIME 


COMMAND 


949 pts/0 


S 


0:00 


. /exempl e_zombie_l 


processus 


fils 949 


se termine 


PID TTY 


STAT 


TIME 


COMMAND 


949 pts/0 


Z 


0:00 


[exempl e_zombie_ <defunct>] 


PID TTY 


STAT 


TIME 


COMMAND 


949 pts/0 


Z 


0:00 


[exempl e_zombie_ <defunct>] 


PID TTY 


STAT 


TIME 


COMMAND 


949 pts/0 


Z 


0:00 


[exempl e_zombie_ <defunct>] 


PID TTY 


STAT 


TIME 


COMMAND 


949 pts/0 


Z 


0:00 


[exempl e_zombie_ <defunct>] 
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$ ps 949 

PID TTY STAT TIME COMMAND 

$ 

Lorsque le processus pere se finit, on invoque manuellement la commande ps, et on s'apercoit 
que le fils zombie a disparu. Dans ce cas, le processus numero 1, i ni t, adopte le processus fils 
orphelin et lit son code de retour, ce qui provoque sa disparition. Dans ce second exemple, le 
processus pere va se terminer au bout de 2 secondes, alors que le fils va continuer a afficher 
regulierement le PID de son pere. 

exemple_zombie_2.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 



int 
main (void) 

{ 

pid_t pid; 



if ((pid = forkO) < 0) { 

fprintf (stderr, "echec fork()\n"); 
exit(EXIT_FAILURE) ; 

} 



if (pid != 0) { 

/* processus pere */ 
fprintf (stdout, "Pere : mon 
sleep(2) ; 

fprintf (stdout, "Pere : j 
exit(EXIT_SUCCESS); 
} else { 

/* processus fils */ 

fprintf (stdout, "Fils 

sleep(l) ; 

fprintf (stdout, "Fils 
sleep(l) ; 

fprintf (stdout, "Fils 
sleep(l) ; 

fprintf (stdout, "Fils 
sleep(l) ; 

fprintf (stdout, "Fils 
} 

return EXIT_SUCCESS; 



D est %1 d\n" , (long)getpidO); 
termine \n") ; 



: mon pere est %1 d\n " , 
(long)getppid ()); 

: mon pere est %1 d\n " , 
(long)getppid ()); 

: mon pere est %1 d\n " , 
(long)getppid ()); 

: mon pere est %1 d\n " , 
(long)getppid ()); 

: mon pere est %1 d\n " , 
(long)getppid ()); 
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L' execution suivante montre bien que le processus 1 adopte le processus fils des que le pere se 
termine. Au passage, on remarquera que, aussitot le processus pere termine, le shell reprend 
la main et affiche immediatement son symbole d'accueil ($) : 

$ ./exemple_zombie_2 

Pere : mon PID est 1006 
Fils : mon pere est 1006 
Fils : mon pere est 1006 
Pere : je me termine 
$ Fils : mon pere est 1 
Fils : mon pere est 1 
Fils : mon pere est 1 

Pour lire le code de retour d'un processus fils, il existe quatre fonctions : wait( ), waipid( ), 
wait3( ) et wait4( ). Nous les etudierons dans cet ordre, qui est de complexite croissante. Les 
trois premieres sont d'ailleurs des fonctions de bibliotheque implementees en invoquant 
wa i t4 ( ) qui est le seul veritable appel-systeme. 

La fonction wai t( ) est declaree dans <sys/wait.h>, ainsi : 

pid_t wait (int * status); 

Lorsqu'on l'invoque, elle bloque le processus appelant jusqu' a ce qu'un de ses fils se termine. 
Elle renvoie alors le PID du fils termine. Si le pointeur status est non NULL, il est renseigne 
avec une valeur informant sur les circonstances de la mort du fils. Si un processus fils etait 
deja en attente a l'etat zombie, wai t( ) revient immediatement. Si on n'est pas interesse par les 
circonstances de la fin du processus fils, il est tout a fait possible de fournir un argument NULL. 

La maniere dont sont organisees les informations au sein de l'entier status est opaque, et il 
faut utiliser les macros suivantes pour analyser les circonstances de la fin du fils : 

• WIFEXITED( status) est vraie si le processus s'est termine de son propre chef en invoquant 
exit( ) ou en revenant de mai n( ). On peut obtenir le code de retour du processus fils, c'est- 
a-dire la valeur transmise a exi t( ) , en appelant WEXITSTATUSC status ). 

• WIFSIGNALED( status) indique que le fils s'est termine a cause d'un signal, y compris le signal 
SIGABRT, envoye lorsqu'il appelle abort( ). Le numero du signal ayant tue le processus fils 
est disponible en utilisant la macro WTERMSIG( status). A ce moment, la macro WC0RE- 
DUMP( status) signale si une image memoire core a ete creee. 

• WIFST0PPED( status) indique que le fils est stoppe temporairement. Le numero du signal 
ayant stoppe le processus fils est accessible en utilisant WST0PSIG( status ). 



Attention 

Les macros WEXITSTATUS, WTERMSIG et WST0PSIG n'ont de sens que si les macros WIFxxx correspon- 
dantes ont renvoye une valeur vraie. 



La fonction wait( ) peut echouer et renvoyer -1, en placant l'erreur ECHILD dans errno si le 
processus appelant n'a pas de fils. Dans notre premier exemple, le processus pere va se 
dedoubler en une serie de fils qui se termineront de manieres variees. Le processus pere 
restera en boucle sur wait( ) jusqu'a ce qu'il ne reste plus de fils. 
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exemple_wait_1.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <signal .h> 
#include <sys/wait.h> 

void affichage_type_de_terminaison ( pi d_t pid, int status); 
int processus_f i 1 s (int numero_f i 1 s ) ; 

int 
main (void) 

{ 

pid_t pid; 

int status; 

int numero_fils; 

for (numero_fi 1 s = 0; numero_fils < 4; numero_f i 1 s ++) { 
switch (forkO) { 
case -1 : 

fprintf (stderr, "Erreur dans fork( )\n" ) ; 
exi t( EXIT_FAI LURE) ; 
case 0 : 

fprintf(stdout, "Fils U : PID = %1 d\n" . 

numero_fi 1 s , (long)getpidO); 
return processus_fils(numero_fils) ; 
default : 

/* processus pere */ 
break; 

} 

} 

/* Ici il n'y a plus que le processus pere */ 
while ((pid = wait(& status)) > 0) 

affichage_type_de_terminaison(pid, status) ; 
return EXIT_SUCCESS; 

} 

void 

affichage_type_de_terminaison (pid_t pid, int status) 
{ 

fprintf (stdout, "Le processus %ld ", (long)pid); 
if (WIFEXITED(status)) { 

fprintf (stdout, "s'est termine normal ement avec le code JSdAn", 
WEXITSTATUS(status)); 
} else if (WIFSIGNALED(status)) { 

fprintf (stdout, "s'est termine a cause du signal %d (%s)\n", 
WTERMSIG(status), 
sys_sigl i st [WTERMSIGt status )]) ; 
if (WCOREDUMP(status)) { 

fprintf (stdout, "Fichier image core cree \n"); 

} 

} else if (WIFSTOPPED(status)) { 
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fprintf (stdout, "s'est arrete a cause du signal %d (%s)\n", 
WSTOPSIG(status), 
sys_sigl ist[WSTOPSIG( status)] ) ; 

} 

} 

int 

processus_fils (int numero_fi 1 s ) 
{ 

switch (numero_fils) { 
case 0 : 

return 1; 
case 1 : 

exit(2) ; 
case 2 : 

abort( ) ; 
case 3 : 

raise(SIGUSRl); 

} 

return numero_fi 1 s ; 

} 

L' execution suivante montre bien les differents types de fin des processus fils : 

$ ./exemple_wait_l 

Fils 0 : PID = 1353 
Fils 1 : PID = 1354 
Fils 2 : PID = 1355 

Le processus 1355 s'est termine a cause du signal 6 (Aborted) 
Fichier image core cree 

Le processus 1354 s'est termine normalement avec le code 2 
Le processus 1353 s'est termine normalement avec le code 1 
Fils 3 : PID = 1356 

Le processus 1356 s'est termine a cause du signal 10 (User defined 1) 
$ 

Notons qu'il n'y a pas de difference entre un retour de la fonction mai n( )(fils 0, PID 1353) et 
un appel exit( )(fils 1, PID 1354). De meme, on voit que l'appel abort( ) (fils 2, PID 1355) se 
traduit bien par un envoi du signal SIGABRT (6 sur notre machine), avec creation d'un fichier 
core. Le signal SIGUSR1 termine le processus mais ne cree pas d'image core. 

II y a deux inconvenients avec la fonction wa i t ( ) , qui ont conduit a developper la fonction 
waitpidO que nous allons voir ci-dessous. Le premier probleme, c'est que l'appel reste 
bloquant tant qu'aucun fils ne s'est termine. II n'est done pas possible d'appeler systemati- 
quement wait( ) dans une boucle principale du programme pour savoir ou en est le fils. La 
solution est d'installer un gestionnaire pour le signal SIGCHLD qui est emis des qu'un fils se 
termine ou est stoppe temporairement. 

Le second probleme vient du fait qu'il n'est pas possible d'attendre la fin d'un fils particulier. 
Dans ce cas, il faut alimenter dans le gestionnaire du signal SIGCHLD une liste des fils termines, 
qu'on consultera dans le programme principal en attente d'un processus donne. II ne faut pas 
oublier de bloquer temporairement SIGCHLD lors de la consultation de la liste, pour eviter 
qu'elle ne soit modifiee pendant ce temps par l'arrivee d'un signal. 
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Pourpallier ces deux problemes, un appel-systeme supplementaire est disponible, waitpid( ), 
dont le prototype est declare dans <sys/wait.h> ainsi : 

pid_t waitpid (pid_t pid, int * status, int options); 

Le premier argument, pi d, permet de determiner le processus fils dont on desire attendre la fin. 

• Si pi d est strictement positif, la fonction attend la fin du processus dont le PID correspond 
a cette valeur. 

• Si pi d vaut 0, on attend la fin de n'importe quel processus fils appartenant au meme groupe 
que le processus appelant. 

• Si pid vaut -1, on attend la fin de n'importe quel fils, comme avec la fonction wai t( ). 

• Si pi d est strictement inferieur a -1, on attend la fin de n'importe quel processus fils appar- 
tenant au groupe de processus dont le numero est -pid. 

Le second argument, status, a exactement le meme role que wait( ). 

Le troisieme argument permet de preciser le comportement de wai tpid( ), en associant par un 
eventuel OU binaire les constantes suivantes : 



Norn Signification 

WNOHANG Ne pas rester bloque si aucun processus correspondant aux specifications fournies par 

1 'argument pid n'est termine. Dans ce cas, waitpid( ) renverra 0. 

WUNTRACED Acceder egalement aux informations concernant les processus fils temporairement stoppes. 

C'est dans ce cas que les macros WIFST0PPED( status) etWST0PSIG( status) prennent leur 
signification. 

Comme on le devine, il est aise d'implementer wait( ) a partir de waitpid( ) : 
pid_t 

mon_wait (int * status) 
{ 

return waitpid(-l, status, 0); 

} 

Nous allons utiliser un programme de demonstration dans lequel un processus fils, qui reste 
en boucle, sera surveille par le processus pere, alors qu'un second fils, qui se termine au bout 
de quelques secondes, n'est pas pris en consideration. Nous agirons sur une seconde console 
pour examiner le status des fils avec la commande ps, et pour stopper et relancer le premier 
fils. 

exemple_wait_2.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <signal .h> 

#include <sys/wait.h> 

int 
main (void) 

{ 
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pid_t pid; 
int status; 

switch (pid = fork( ) ) { 
case -1 : 

fprintf (stderr, "Erreur dans fork()\n"); 
exit(EXIT_FAILURE); 
case 0 : /* fils 1 */ 

fprintf(stdout, "Fils 1 : PID = %ld\n" , (long)getpidt ) ) ; 
while (1) 
pause( ) ; 
default : /* pere */ 
break; 

} 

/* Creons un fils qu'on n'attend pas */ 
switch (fork ()) { 
case -1 : 

fprintf (stderr, "Erreur dans fork()\n"); 
exit(EXIT_FAILURE); 
case 0 : /* fils 2 */ 

fprintf(stdout, "Fils 2 : PID = %ld\n" , (long)getpidO); 
sleep(2) ; 

exit(EXIT_SUCCESS); 
default : /* pere */ 
break; 

} 

while (1) { 
sleep(l) ; 

if (waitpid(pid, & status, WUNTRACED | WNOHANG) > 0) { 
if (WIFEXITED(status)) { 

fprintf (stdout, "%ld termine par exit (%d)\n", 
(long)pid, WEXITSTATUS(status) ) ; 
exit(EXIT_SUCCESS); 
} else if (WIFSIGNALED (status)) { 

fprintf (stdout, "%ld termine par signal %d\n", 

(long)pid, WTERMSIG(status) ) ; 
exit(EXIT_SUCCESS); 
} else if (WIFSTOPPED(status)) { 

fprintf (stdout, "£ld stoppe par signal M\n", 
(long)pid, WSTOPSIG(status) ) ; 

} 

} 

} 

return EXIT_SUCCESS; 

} 

L' execution suivante montre en seconde colonne les actions depuis l'autre Xterm : 

$ . /exemple_wait_2 

Fils 1 : PID = 1525 
Fils 2 : PID = 1526 
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$ ps 1525 1526 
PID TTY STAT COMMAND 

1525 pts/0 S ./exemple_wait_2 

1526 pts/0 Z [exemple_wait_2 <defunct>] 
$ kill -STOP 1525 

1525 stoppe par signal 19 

$ ps 1525 1526 
PID TTY STAT COMMAND 

1525 pts/0 T ./exemple_wait_2 

1526 pts/0 Z [exemple_wait_2 <defunct>] 
$ kill -CONT 1525 

$ kill -TSTP 1525 
1525 stoppe par signal 20 

$ kill -CONT 1525 

$ kill -TERM 1525 
1525 termine par signal 15 
$ 

Nous voyons que le fils 2, de PID 1526, reste a l'etat zombie des qu'il se finit car le pere ne 
demande pas son code de retour. Le fait d'avoir appele Foption WUNTRACED nous permet d'etre 
informe lorsque le processus fils 1 est temporairement stoppe par un signal. 

Les fonctions waitO et waitpidO sont definies par SUSv3, contrairement aux deux autres 
fonctions que nous allons etudier, wait3() et wait4(), qui sont d'inspiration BSD. Elles 
permettent, par rapport a wait( ) ou waitpid( ) , d'obtenir des informations supplementaires 
sur le processus qui s'est termine. Ces renseignements sont transmis par F intermediate d'une 
structure rusage, definie dans <sys/resource.h>. 

Cette structure regroupe des statistiques sur 1' utilisation par le processus des ressources 
systeme. Le type struct rusage contient les champs suivants : 



Type 




Nom 


Signification 


struct 


timeval 


ru_ 


_utinie 


Temps passe par le processus en mode utilisateur. 


struct 


timeval 


ru_ 


_stime 


Temps passe par le processus en mode noyau. 


long 




ru_ 


jnaxrss 


Taille maximale des donnees placees simultanement en memoire (exprimee 
en Ko). 


long 




ru_ 


_ixrss 


Taille de la memoire partagee avec d'autres processus (exprimee en Ko). 


long 




ru_ 


_idrss 


Taille des donnees non partagees (en Ko). 


long 




ru_ 


_i srss 


Taille de la pile exprimee en Ko. 


long 




ru_ 


_minflt 


Nombre de fautes de pages mineures (n'ayant pas necessite de recharge- 
ment depuis ledisque). 


long 




ru_ 


jnajfl t 


Nombre de fautes de pages majeures (ayant necessite un rechargement des 
donnees depuis le disque). 


long 




ru_ 


_nswap 


Nombre de fois ou le processus a ete entierement swappe. 


long 




ru_ 


_inblock 


Nombre de fois ou des donnees ont ete lues. 


long 




ru_ 


_oubl ock 


Nombre de fois ou des donnees ont ete ecrites. 


long 




ru_ 


_msgsnd 


Nombre de messages envoyes par le processus. 


long 




ru_ 


_msgrcv 


Nombre de messages recus par le processus. 
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Type 


Nom 


Signification 


long 


ru_nsignals 


Nombre de signaux recus par le processus 


long 


ru_nvcsw 


Nombre de fois oil le programme a volontairement cede le processeur en 
attendant la disponibilite d'une ressource. 


long 


rujivcsw 


Nombre de fois ou le processus a ete interrompu par I'ordonnanceur car il 
etait arrive a la fin de sa tranche de temps impartie, ou qu'un processus plus 
prioritaire etait pret. 



La structure rusage est assez riche, malheureusement Linux ne remplit que tres peu de champs. 
Les seules informations renvoyees sont les suivantes : 

• Les temps ru_utime et ru_stime. 

• Les nombres de fautes de pages ru_mi nf 1 1 et ru_ma jf 1 1. 

• Le nombre de fois ou le processus a ete swappe ru_nswap. 

Les donnees fournies par cette structure sont surtout utiles lors de la mise au point d' applica- 
tions assez critiques, si on desire suivre tres precisement la gestion memoire ou les entrees- 
sorties d'un processus. 

La structure timeval qu'on rencontre dans les deux premiers champs se decompose elle- 
meme ainsi (<sys/time.h>) : 



Type 


Nom 




Signification 


long 


tv_sec 


Nombre de secondes 




long 


tv_usec 


Nombre de microsecondes 





Suivant les bibliotheques utilisees, les membres de la structure timeval ont parfois un autre 
type que long int, notamment time_t. Quoi qu'il en soit, ces types de donnees peuvent etre 
affichees comme des entiers longs, avec le format « %1 d » de f pri ntf ( ). 

Le prototype de la fonction wai t3( ) est le suivant : 

j pid_t wait3 (int * status, int options, struct rusage * rusage); 

Les options de wait3() sont les memes que celles de waitpidO, c'est-a-dire WNOHANG et 
WUNTRACED. Le status est egalement le meme qu'avec wait( ) ou waitpid( ), et on utilise les 
memes macros pour 1' analyser. 

Nous pourrions definir wait( ) en utilisant wait3(status, 0, NULL). 

Dans notre exemple, nous allons afficher les valeurs de la structure rusage representant le 
temps passe par le processus en mode utilisateur et le temps passe en mode noyau. 

exemple_wait_3.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <signal .h> 
#include <errno.h> 
#include <sys/wait.h> 
#include <sys/resource.h> 
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i nt 
main (void) 

{ 

pid_t pid; 
int status; 
struct rusage usage; 
int i , j ; 

switch (pid = forkO) { 
case -1 : 

fprintf (stderr, "Erreur dans fork()\n"); 
exit(EXIT_ FAILURE); 
case 0 : /* fils */ 

fprintf(stdout, "Fils : PID = %1 d\n" , (long)getpidO); 
j = 0; 

for (1 = 0; 1 < 5000000; i ++) 

j += 1: 
raise(SIGSTOP); 

for (i = 0; i < 500000; i ++) { 
FILE * fp; 

fp = fopen( "exempl e_wait_2" , "r"); 
if (fp != NULL) 
fclose(fp) ; 

} 

exit(EXIT_SUCCESS); 
default : /* pere */ 
break; 



while (1) { 
sleep(l) ; 

if ((pid = wait3(& status, WUNTRACED | WN0HANG, & usage)) > 0) { 
if (WIFEXITED(status)) { 

fprintf (stdout, "£ld termine par exit (M)\n", 

(long)pid, WEXITSTATUSt status) ) ; 
} else if (WIFSIGNALED (status)) { 

fprintf (stdout, "£ld termine par signal %d\n", 
(long)pid, WTERMSIG(status) ) ; 
} else if (WIFST0PPED (status)) { 

fprintf (stdout, "£ld stoppe par signal M\n", 

(long)pid, WSTOPSIG(status) ) ; 
fprintf (stdout, "Je le relance \n"); 
kill (pid, SIGC0NT); 

} 

fprintf (stdout, "Temps utilisateur %ld s, %ld ps\n", 
usage. ru_utime. tv_sec , 
usage. ru_utime.tv_usec) ; 
fprintf (stdout, "Temps en mode noyau 1f\<i s, &ld us\n", 
usage. ru_stime.tv_sec, 
usage. ru_stime.tv_usec) ; 
} else if (errno == ECHILD) { 
/* Plus de fils */ 
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break; 

} 

} 

return EXIT_SUCCESS; 

} 

Le processus fils effectue une boucle, en mode utilisateur uniquement, avant de se stopper 
lui-meme. Le processus pere le relance alors. Le fils passe ensuite a une boucle au sein 
de laquelle il fait des appels-systeme, et fonctionne done en mode noyau. Voici un exemple 
d' execution : 

$ ./exemple_wait_3 

Fils : PID = 2017 

2017 stoppe par signal 19 

Je le relance 

Temps utilisateur 0 s, 100000 us 

Temps en mode noyau 0 s, 0 us 

2017 termine par exit (0) 

Temps utilisateur 1 s, 610000 us 

Temps en mode noyau 2 s, 290000 ps 

$ 

La derniere fonction de cette famille est wait4( ). Elle permet d'obtenir a la fois des statisti- 
ques, comme avec wait3( ), et d'attendre un processus fils particulier, comme waitpid( ). Le 
prototype de cette fonction est le suivant : 

pid_t wait4 (pid_t pid, int * status, 

int options, struct rusage * rusage); 

La fonction wait4( ) est la seule qui soit un veritable appel-systeme sous Linux ; les autres 
fonctions de cette famille en decoulent ainsi : 





Fonction 






Implementation 


wait3 (status 


options, usage) 


wait4 


(-1, 


status, options, usage) 


waitpid (pid. 


status, options) 


wait4 


(pid 


status, options, NULL) 


wait (status) 




wait4 


(-1, 


status, 0, NULL) 



Depuis Linux 2.6, un nouvel appel-systeme a fait son apparition : wai ti d ( ) . II permet en outre 
d'attendre qu'un processus fils redemarre apres un arret, et d'obtenir les informations de 
status dans un format different (une structure si gi nf o_t que nous verrons dans le chapitre 8). 
Les constantes symboliques necessaires au fonctionnement de waitid n'etant pas disponibles 
dans la bibliotheque C au moment de la redaction de ces lignes, nous ne le detaillerons pas plus. 
Le lecteur interesse pourra se reporter au standard SUSv3 qui decrit son fonctionnement. 

Signaler une erreur 

II y a des cas oil la gestion d' erreur doit etre moins drastique qu'un arret anormal du pro- 
gramme. Pour cela, les appels-systeme remplissent la variable globale externe errno avec une 
valeur numerique entiere representant le type d'erreur qui s'est produite. Toutes les valeurs 
representant une erreur sont non nulles. 
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Attention 

Le fait que errno soit remplie avec une valeur non nulle n'est pas suffisant pour en deduire qu'une erreur 
s'est produite. II faut pour cela que I'appel-systeme echoue explicitement (la plupart du temps en renvoyant 
-1 et non pas 0). Ceci est encore plus vrai avec des routines de bibliotheque qui peuvent invoquer plusieurs 
appels-systeme et remedier aux conditions d'erreur. errno sera alors modifiee a plusieurs reprises avant le 
retour de la fonction. SUSv3 autorise les fonctions de bibliotheque a modifier errno meme lorsqu'elles reus- 
sissent a faire leur travail. 



II existe des constantes symboliques representant chaque erreur possible. Elles sont definies 
dans le fichier <errno.h>. Toutefois, celui-ci inclut automatiquement <bits/errno.h>, 
<linux/errno.h> et <asm/errno.h>, qui definissent Fessentiel des constantes d'erreur. II est 
bon de connaitre l'existence de ces fichiers car un coup d'ceil rapide permet parfois d'identi- 
fier une erreur qu'on n'avait pas prevue, a partir de son numero. Les principales erreurs qu'on 
rencontre frequemment dans les appels-systeme sont decrites dans le tableau ci-dessous. 
Nous en avons limite la liste aux plus courantes. II en existe de nombreuses autres, par 
exemple dans le domaine de la programmation reseau, que nous detaillerons le moment venu. 



Nom 


Signification 


E2BIG 


La liste d'arguments fournie a Tune des fonctions de la famille exec ( ) est trap longue. 


EACCES 


Lacces demande est interdit, par exemple dans une tentative d'ouverture de fichier avec open ( ) . 


EAGAIN 


Loperation est momentanement impossible, il faut reessayer. Par exemple, on demande une lecture 
non bloquante avec read( ) , mais aucune donnee n'est encore disponible. 


EBADF 


Le descripteur de fichier transmis a I'appel-systeme, par exemple closet ), est invalide. 


EBUSY 


Le repertoire ou le fichier considere est en cours d'utilisation. Ainsi, umount ( ) ne peut demonter 
un peripherique si un processus I'utilise alors comme repertoire de travail. 


ECHILD 


Le processus attendu par waitpid( ) ou wait4( ) n'existe pas ou n'est pas un fils du processus 
appelant. 


EDEADLK 


Le verrouillage en ecriture par f cntl ( ) du fichier demande conduirait a un blocage. 


EDOM 


La valeur transmise a la fonction mathematique est hors de son domaine de defi nition. Par exemple, 
on appelle acos ( ) avec une valeur inferieure a -1 ou superieure a 1 . 


EEXIST 


Le fichier ou le repertoire indique pour une creation existe deja. Par exemple, avec openO, 
mkdirt ), mknod( )... 


E FAULT 


Un pointeur transmis en argument pointe en dehors de I'espace d'adressage du processus . Cette 
erreur revele un bogue grave dans le programme. 


EFBIG 


On a tente de creer un fichier de taille plus grande que la limite autorisee pour le processus. 


EINTR 


Lappel-systeme a ete interrompu par I'arrivee d'un signal qui a ete intercepts par un gestionnaire 
installe par le processus. 


EINVAL 


Un argument de type entier, ou represents par une constante symbolique, a une valeur invalide 
ou incoherente. 


EIO 


Une erreur d'entree-sortie de bas niveau s'est produite pendant un acces au fichier. 


EISDIR 


Le descripteur de fichier transmis a I'appel-systeme, par exemple read ( ) , correspond a un reper- 
toire. 


EL00P 


On a rencontre trap de liens symboliques successifs, il y a probablement une boucle entre eux. 



116 



Programmation systeme en C sous Linux 



Nom 


Signification 


EMFILE 


Le processus a atteint le nombre maximal de fichiers ouverts simultanement. 


LML1NK 


On a deja cree le nombre maximal de liens sur un fichier. 


ENAMETOOLONG 


Le chemin d'acces transmis en argument, par exemple pour chdir( ), est trop long. 


ENFILE 


On a atteint le nombre maximal de fichiers ouverts simultanement sur I'ensemble du systeme. 


ENODEV 


Le fichier special de peripherique n'est pas valide, par exemple dans I'appel-systeme mount ( ). 


ENOENT 


Un repertoire contenu dans le chemin d'acces fourni a I'appel-systeme n'existe pas, ou est un lien 
symbolique pointant dans le vide. 


ENOEXEC 


Le fichier executable indique a I'un des appels de la famille exec( ) n'est pas dans un format 
reconnu par le noyau. 


ENOLCK 


II n'y a plus de place dans la table systeme pour ajouter un verrou avec I'appel-systeme f cntl ( ) . 


ENOMEM 


II n'y a plus assez de place memoire pour allouer une structure supplemental dans une table 
systeme. 


ENOSPC 


Le peripherique sur lequel on veut creer un nouveau fichier ou ecrire des donnees supplemen- 
taires n'a plus de place disponible. 


ENOSYS 


La fonctionnalite demandee par I'appel-systeme n'est pas disponible dans le noyau. II peut s'agir 
d'un probleme de version ou d'options lors de la compilation du noyau. 


ENOTBLK 


Le fichier special qu'on tente de monter avec mountt ) ne represents pas un peripherique de type 
« bloc ». Cette erreur n'est pas decrite dans SUSv3. 


ENOTDIR 


Un element du chemin d'acces fourni n'est pas un repertoire. 


ENOTEMPTY 


Le repertoire qu'on veut detruire n'est pas vide, ou le nouveau nom d'un repertoire a renommer 
existe deja et n'est pas vide. 


ENOTTY 


Le fichier indique en argument a i octl ( ) n'est pas un terminal. 


ENXIO 


Le fichier special indique n'est pas reconn u par le noyau (par exemple un numero de nceud majeur 
invalide). 


EPERM 


Le processus appelant n'a pas les autorisations necessaires pour effectuer I'operation prevue. 
Souvent, il s'agit d'une fonctionnalite reservee a root. 


EPIPE 


Tentative d'ecriture avec wri te( ) dans un tube dont I'autre extremite a ete fermee par le proces- 
sus lecteur. Cette erreur n'est envoyee que si le signal SIGPIPE est bloque ou ignore. 


ERANGE 


Une valeur numerique attendue dans une fonction mathematique est invalide. 


EROFS 


On tente une modification sur un fichier appartenant a un systeme de fichiers monte en lecture 
seule. 


ESPIPE 


On essaye de deplacer le pointeur de lecture, avec lseekt ), sur un descripteur de fichier ne le 

pel niclldlll pdo, UUIIIIIIC UN lUUc UU UMc bUCKcl. 


ESRCH 


Le processus vise, par exemple avec ki 1 1 ( ) , n'existe pas. 


ETXTBSY 


On essaye d'executer un fichier deja ouvert en ecriture par un autre processus. 


EWOULDBLOCK 


Synonyme de EAGAI N qu'on rencontre dans la description de nombreuses fonctionnalites reseau. 


EXDEV 


On essaye de renommer un fichier ou de creer un lien materiel entre deux systemes de fichier 
differents. 



On voit, a Fenonce d'une telle liste (qui ne represente qu'un tiers environ de toutes les erreurs 
pouvant se produire sous Linux), qu'il est difficile de gerer tous les cas a chaque appel- 
systeme effectue par le programme. 
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Alors que faire si, par exemple, l'appel-systeme openO echoue ? A lui seul, il peut deja 
renvoyer une bonne quinzaine d'erreurs differentes. Tout depend du degre de convivialite du 
logiciel developpe. Dans certains cas, on peut se contenter de mettre un message sur la sortie 
d'erreur « impossible d'ouvrir le fichier xxx », et arreter le programme. A F oppose, on peut 
aussi diagnostiquer qu'un des repertoires du chemin d'acces est invalide et afficher pour 
Futilisateur la liste des repertoires du meme niveau pour qu'il corrige son erreur. 

Ainsi, certaines erreurs ne doivent jamais se produire dans un programme bien debogue. 
C'est le cas de EFAULT, qui signale un pointeur mal initialise, de EDOM ou ERANGE, qui indi- 
quent qu'une fonction mathematique a ete appelee sans verifier si les variables appartiennent 
a son domaine de definition. Ces cas-la peuvent etre controles dans des appels a assert( ) , car 
il s'agit de bogues a eliminer avant la distribution du logiciel. 

Dans d'autres cas, le probleme concerne le systeme, et le pauvre programme ne peut rien faire 
pour corriger Ferreur. C'est le cas par exemple de ENOMEM, qui indique que le noyau n'a plus 
assez de place memoire, ou de ENFILE, qui se produit lorsque le nombre maximal de fichiers 
ouverts sur le systeme est atteint. II n'y a guere d'autres possibilites alors que d'abandonner 
Foperation apres avoir signale le probleme a Futilisateur. 

La regie absolue est de ne jamais passer sous silence les conditions d'erreur qui paraissent 
improbables. Si une application doit etre distribute largement et utilisee pendant de longues 
heures par ses utilisateurs, il est pratiquement certain qu'elle sera un jour confronted au 
probleme d'une partition disque saturee. Ignorer le code de retour de write( ) reviendra a ne 
pas sauvegarder le travail de Futilisateur, alors qu'un simple message d'avertissement lui 
aurait permis d'effacer des fichiers inutiles et de refaire une sauvegarde. 

Si on ne desire pas traiter au cas par cas toutes les erreurs possibles, on peut employer la fonc- 
tion strerror( ) , declaree dans <stri ng . h> ainsi : 

] char * strerror (int numero_erreur) ; 

Cette fonction renvoie un pointeur sur une chaine de caracteres statique decrivant Ferreur 
produite. Cette chaine de caracteres peut etre ecrasee a chaque nouvel appel de strerror( ). 
Pour eviter ce probleme dans le cas d'une programmation multi-thread, on peut utiliser 
l'extension Gnu strerror_r( ), declaree ainsi : 

char * strerror_r (int numero_erreur, char * chaine, size_t longueur) 

Cette fonction n'ecrit jamais dans la chaine plus d' octets que la longueur indiquee, y compris 
le caractere nul final. 

Dans tous les cas, il convient de consulter la page de manuel des appels-systeme et des fonc- 
tions de bibliotheque employes (en esperant que les informations soient a jour), et de prevoir 
une gestion adequate pour les erreurs les plus frequentes. Une gestion generique peut etre 
mise en place pour les cas les plus rares. Prenons l'exemple de open( ). Une maniere assez 
simple mais correcte d'operer serait : 

while (1) { 

if ((fd = open(fichier, mode)) == -1) { 
assert(errno != EFAULT); 
switch (errno) { 
case EMFILE : 
case ENFILE : 
case ENOMEM : 
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fprintf (stderr, "Erreur critique : £s\n", 
strerror(errno) ) ; 

return -1; 
default : 

fprintf (stderr, "Erreur d'ouverture de %s : £s\n", 
fichier, strerror(errno) ) ; 

break; 

} 

if (corriger_le_nom_pour_reessayer( ) != 0) 
/* 1 'utilisateur prefere abandonner */ 
return -1; 

el se 

continue; /* recommencer */ 

} else { 

/* pas d'erreur */ 
break; 

} 

return 0; 

} 

Cela permet a la fois de differencier les erreurs irrecuperables de celles qu'on peut corriger, et 
donne a l'utilisateur la possibility de modifier sa demande ou d'abandonner l'operation. 

Nous allons voir un petit exemple d'utilisation de strerror( ), en l'invoquant pour une dizaine 
d' erreurs courantes : 

exemple_strerror.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <errno.h> 



int 
main (void) 
{ 

fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 



"strerror(EACCES) = %s\n 

"strerror(EAGAIN) = %s\n 

"strerror(EBUSY) = %s\n 

"strerror(ECHILD) = %s\n 

"strerror(EEXIST) = %s\n 

"strerror(EFAULT) = %s\n 

"strerror(EINTR) = %s\n 

"strerror(EINVAL) = %s\n 

"strerror(EISDIR) = %s\n 

"strerror(EMFILE) = %s\n 

"strerror(ENODEV) = %s\n 

"strerror(ENOMEM) = %s\n 

"strerror(ENOSPC) = %s\n 

"strerror(EPERM) = %s\n 

"strerror(EPIPE) = %s\n 

"strerror(ESRCH) = %s\n 



strerror(EACCES)) 
strerror(EAGAIN)) 
strerror(EBUSY) ) 
strerror(ECHILD)) 
strerror(EEXIST)) 
strerror(EFAULT)) 
strerror(EINTR) ) 
strerror(EINVAD) 
strerror(EISDIR)) 
strerror(EMFILE)) 
strerror(ENODEV)) 
strerror(ENOMEM)) 
strerror(ENOSPO) 
strerror(EPERM) ) 
strerror(EPIPE) ) 
strerror(ESRCH) ) 
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return EXIT_SUCCESS; 

I > 

L' execution montre que la fonction strerror( ) de la GlibC est sensible a la localisation : 



$ echo $LC_ALL 






fr_FR 






$ ./exemple_strerror 


strerror( EACCES) 




Permission non accordee 


strerror(EAGAIN) 


_ 


Ressource temporai rement non disponible 


strerror(EBUSY) 




Peripherique on ressource occupe 


strerror(ECHILD) 




Aucun processus enfant 


strerror(EEXIST) 




Le fichier existe 


strerror(EFAULT) 




Mauvaise adresse 


strerror(EINTR) 




Appel -systeme interrompu 


strerror(EINVAL) 




Parametre invalide 


strerror(EISDIR) 




Est un repertoire 


strerror(EMFILE) 




Trop de fichiers ouverts 


strerror(ENODEV) 




Aucun peripherique de ce type 


strerror(ENOMEM) 




Ne peut allouer de la memoire 


strerror(ENOSPC) 




Aucun espace disponible sur le peripherique 


strerror(EPERM) 




Operation non permise 


strerror(EPIPE) 




Relais brise (pipe) 


strerror(ESRCH) 




Aucun processus de ce type 



$ 

II existe egalement une fonction permettant d'afficher directement sur la sortie standard, 
precedee eventuellement d'une chaine de caracteres permettant de situer l'erreur. Cette fonc- 
tion, nommee perror( ), est declaree dans <stdio. h> ainsi : 

void perror (const char * s); 

On l'utilise generalement de la maniere suivante : 

if ((fd = open(nom_fichier, mode)) == -1) { 
perror( "open" ) ; 
exi t( EXIT_FAI LURE ) ; 

Le message s'affiche ainsi : 

open: Aucun fichier ou repertoire de ce type 
II s'agit dans ce cas de l'erreur ENOENT. 

Notre exemple va utiliser perror( ) en cas d'echec de fork( ). Pour faire echouer celui-ci, nous 
allons diminuer la limite RLIMI^NPROC 1 , puis nous bouclerons sur un appel fork( ). 

exemple_perror.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <sys/resource.h> 



1. Les limites d'execution des processus sont etudiees dans le chapitre 9. 
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//include <sys/wait.h> 

int 
main (void) 
{ 

struct rlimit limite; 
pid_t pid; 

if (getrlimit(RLIMIT_NPROC, & limite) != 0) { 
perror( "getrl imi t" ) ; 
exit(EXIT_FAILURE); 

} 

limite.rlim_cur = 16; 

if (setrlimit(RLIMIT_NPROC, & limite) != 0) { 
perror( "setrl imi t" ) ; 
exit(EXIT_FAILURE); 

} 

while (1) { 

pid = fork( ) ; 
if (pid == (pid_t) -1) { 
perror( "fork" ) ; 
exit(EXIT_FAILURE); 

} 

if (pid != 0) { 

fprintf (stdout, "%1 d\n " , (long)pid); 
if (waitpidtpid, NULL, 0) != pid) 

perrorCwaitpid"); 
break; 

} 

} 

return EXIT_SUCCESS; 

} 

Comme nous avons deja plusieurs processus qui tournent avant meme de lancer le programme, 
nous n'atteindrons pas les seize fork( ). Pour verifier le nombre de processus en cours, nous 
allons d'abord lancer une serie de commandes shell, avant d'executer le programme. 

$ ps aux | grep "whoami* |wc -1 

10 

$ ./exemple_perror 

6922 
6923 
6924 
6925 
6926 
6927 
6928 

fork: Ressource temporai rement non disponible 
$ 

Dans les dix processus qui tournaient avant le lancement, il faut compter la commande ps elle- 
meme. II est done normal que f ork( ) n'echoue qu'une fois arrive au septieme processus fils. 
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Le message correspond a celui de l'erreur EAGAIN. En effet, le systeme considere que l'un des 
processus va se finir tot ou tard et que fork( ) pourra reussir alors. 

Un autre moyen d'acceder directement aux messages d'erreur est d' employer la table sys_ 
errl ist[] , definie dans <errno. h> ainsi : 

const char * sys_errlist []; 

Chaque element de la table est un pointeur sur une chame de caracteres decrivant l'erreur 
correspondant a l'index de la chaine dans la table. II existe une variable globale decrivant le 
nombre d' entrees dans la table : 

int sys_nerr; 

II faut etre tres prudent avec les acces dans cette table car il y a des valeurs ne correspondant 
a aucune erreur. C'est le cas, par exemple, de 41 et 58 sous Linux avec la GlibC 2. Pareille- 
ment, dans la meme configuration, sys_nerr vaut 125, ce qui signifie que les erreurs s'eten- 
dent de 0 a 124. Pourtant, il existe une erreur ECANCELED valant 125, non utilisee dans les 
appels-systeme. 

L' acces a la table doit done etre precautionneux, du genre : 

if ((erreur < 0) | | (erreur >= sys_nerr)) { 

fprintf (stderr, "Erreur invalide £d\n", erreur); 
} else if (sys_errl i st[erreur] == NULL) ( 

fprintf (stderr, "Erreur non documented %d\n" , erreur); 
} else { 

fprintf (stderr, "£s\n", sys_errlist[erreur]); 

} 

Nous allons utiliser la table sys_errl i st[] pour afficher tous les libelles des erreurs connues. 
exemple_sys_errlist.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <errno.h> 

int 
main (void) 

{ 

int i ; 

for (i = 0; i < sys_nerr; i++) 
if (sys_errlist[i] != NULL) 

fprintf (stdout, "%d : £s\n", i, sys_errl ist[i ] ) ; 

el se 

fprintf (stdout, "** Pas de message pour %d **\n", i); 
return EXIT_SUCCESS; 

} 

Dans 1' exemple d' execution suivant, nous avons elimine quelques passages pour eviter d' affi- 
cher inutilement toute la liste : 

$ ./exemple_sys_errlist 

0 : Success 

1 : Operation not permitted 
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2 : No such file or directory 

3 : No such process 

4 : Interrupted system call 

5 : Input/output error 

6 : Device not configured 

7 : Argument list too long 

8 : Exec format error 

9 : Bad file descriptor 

10 : No child processes 
[...] 

39 : Directory not empty 

40 : Too many levels of symbolic links 
** Pas de message pour 41 ** 

42 : No message of desired type 
[...] 

56 : Invalid request code 

57 : Invalid slot 

** Pas de message pour 58 ** 

59 : Bad font file format 

60 : Device not a stream 

61 : No data available 

62 : Timer expired 
[--.] 

121 : Remote I/O error 

122 : Disk quota exceeded 

123 : No medium found 

124 : Wrong medium type 
$ 

On remarque plusieurs choses : d'abord les messages de sys_errl ist[] ne sont pas traduits 
automatiquement par la localisation, contrairement a strerror( ), ensuite l'erreur 0, bien que 
documented pour simplifier Faeces a cette table, n'est par definition pas une erreur, enfin les 
erreurs 41 et 58 n'existent effectivement pas. 

Conclusion 

Nous avons etudie dans ce chapitre les principaux points importants concernant la fin d'un 
processus, due a des causes normales ou a un probleme irremediable. 

Nous avons egalement essaye de definir un comportement raisonnable en cas de detection 
d' erreur, et nous avons analyse les methodes pour obtenir des informations sur les raisons 
ayant conduit un processus fils a se terminer. En ce qui concerne le code de debogage, et 
les macros assertO, on trouvera des reflexions interessantes dans [McCONNELL 1994] 
Programmation professionnelle. 

Nous avons aussi indique qu'un processus pouvait etre tue par un signal. Nous allons a 
present developper ce sujet dans les quelques chapitres a venir. 
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La gestion des signaux entre processus est peut-etre la partie la plus passionnante de la 
programmation sous Unix. C'est aussi celle qui peut conduire aux dysfonctionnements les 
plus subtils, avec des bogues tres difficiles a detecter de par leur nature fondamentalement 
intempestive. 

On peut traiter les signaux de deux facons : une classique, en partie definie par la norme Ansi 
C, que nous etudierons dans ce chapitre, et une plus performante, definie a l'origine par les 
normes Posix. 1 et Posix. lb puis de nos jours par SUSv3, ainsi que nous le verrons dans les 
prochains chapitres. 

Generalites 

Le principe est a priori simple : un processus peut envoyer sous certaines conditions un signal 
a un autre processus (ou a lui-meme). Un signal peut etre imagine comme une sorte d'impul- 
sion qui oblige le processus cible a prendre immediatement (aux delais dus a Fordonnan- 
cement pres) une mesure specifique. Le destinataire peut soit ignorer le signal, soit le capturer 
- c'est-a-dire derouter provisoirement son execution vers une routine particuliere qu'on 
nomme gestionnaire de signaux -, soit laisser le systeme traiter le signal avec un comporte- 
ment par defaut. 

La plupart des signaux qui nous interessent ne sont pas emis par des processus applicatifs, 
mais directement par le noyau en reponse a des conditions logicielles ou materielles particu- 
lieres. Certains signaux font partie d'une classe nouvelle, les signaux temps-reel, definis par 
la norme Posix. lb. Nous les etudierons a part, dans le chapitre 8. 

II existe un nombre determine de signaux (32 sous Linux 2.0, 64 depuis Linux 2.2). Chaque 
signal dispose d'un nom defini sous forme de constante symbolique commencant par SIG et 
d'un numero associe. II n'y a pas de nom pour le signal numero 0, car cette valeur a un role 
particulier que nous verrons plus tard. Toutes les definitions concernant les signaux se trou- 
vent dans le fichier d'en-tete <si gnal . h> (ou dans d'autres fichiers qu'il inclut lui-meme). 
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II est important de toujours utiliser le nom symbolique du signal et non son numero, car celui- 
ci peut varier d'un systeme a 1' autre, voire selon la machine employee, meme avec une 
version identique du noyau. La constante symbolique NSIG definie par la bibliotheque C corres- 
pond au nombre de signaux, y compris un pseudo-signal numerate 0. II arrive que, sur certains 
systemes, cette constante soit nommee NSIG. Pour assurer la portabilite d'un programme, on 
peut done inclure en debut de fichier des directives pour le preprocesseur, du type : 

#incl ude <signal .h> 

#ifndef NSIG 
#ifndef _NSIG 

#error "NSIG et _NSIG indefinis" 
#else 

#define NSIG _NSIG 
#endif 
#endif 

Sur les systemes supportant les signaux temps-reel, comme Linux, il existe deux valeurs 
supplementaires importantes : SIGRTMIN et SIGRTMAX. II s'agit des numeros du plus petit et du 
plus grand signal temps-reel. Ces derniers en effet s'etendent sur une plage continue en 
dessous de NSIG-1. Sous Linux, l'organisation des signaux est la suivante : 



Valeur 


Signal 


0 


Signaux classiques 




(non temps-reel) 


31 




32 


SIGRTMIN 




(signaux temps-reel) 


63 


SIGRTMAX 


64 


NSIG 



Attention 

S I G RTM I N et S I G RTMAX ne sont pas necessairement des constantes symboliques du preprocesseur. SUSv3 
autorise leur implementation sous forme de variables. Leur valeur n'est done pas toujours disponible a 
la compilation. Par contre, la constante symbolique _POSIX_REALTIME_S IGNALS doit etre definie dans 
<uni std . h>. 



II nous arrivera de vouloir balayer uniquement la liste des signaux classiques. Pour cela, nous 
definirons une variable locale N B_S I G_C LASSIQUES permettant de travailler sur tous les systemes : 

#ifdef _POSIX_REALTIME_SIGNALS 

#define NB_SIG_CLASSIQUES SIGRTMIN 
#el se 

//define NB_SIG_CLASSIQUES NSIG 
#endif 

Chaque signal classique a une signification bien precise, et les processus ont par defaut un 
comportement adapte a la situation representee par le signal. Par exemple, le signal indiquant 
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la fin d'un processus fils est ignore par defaut. Par contre, la deconnexion du terminal de 
controle envoie un signal qui arrete le processus, et une reference memoire invalide termine le 
processus et cree un fichier d'image memoire (core) permettant le debogage du programme. 

Pour qu'un fichier core soit cree, un certain nombre de conditions sont necessaires : permis- 
sion d'ecrire dans le repertoire de lancement du processus, pas d'execution Set-UID ou Set- 
GID et pas de limitation dans la taille de ces fichiers. Cette limite est fixee avant le lancement 
du processus par la commande shell ul i mi t. Ainsi, il faudra penser a executer la commande : 

$ ulimit -c unlimited 

avant de demarrer une session de debogage, pour s'assurer que les fichiers core soient crees 
sans limite de taille. (Cette operation peut egalement etre realisee directement dans le 
programme, comme nous le verrons dans le chapitre 9.) 

Avant d'etudier les mecanismes d' emission et de reception des signaux, nous allons analyser 
precisement ceux qui sont disponibles sous Linux, en observant les conditions dans lesquelles 
les signaux sont emis, le comportement par defaut d'un processus qui les recoit, et l'interet 
eventuel d' installer un gestionnaire pour les capturer. 

Liste des signaux sous Linux 

Certains signaux sont revelateurs de conditions d'erreur. lis sont en general delivres immedia- 
tement apres la detection du dysfonctionnement. On ne peut done pas vraiment parler de 
comportement asynchrone. Par contre, tous les signaux indiquant une interaction avec l'envi- 
ronnement (action sur le terminal, connexion reseau. . .) ont une nature fortement asynchrone. 
lis peuvent se produire a tout moment du programme. 

Signaux SIGABRT et SIGIOT 

II s'agit de deux synonymes sous Linux. SIGIOT est le nom historique sous Systeme V, mais 
SIGABRT est preferable car il est defini par les normes Ansi C et SUSv3. SIGABRT est declenche 
lorsqu'on appelle la fonction abort ( ) de la bibliotheque C. Le comportement par defaut est de 
terminer le programme en creant un fichier core. La routine abort( ) sert, comme nous l'avons 
vu dans le chapitre precedent, a indiquer la fin anormale d'un programme (detection d'un 
bogue interne, par exemple). 

II est possible d'ignorer le signal SIGABRT (si on le recoit depuis un autre processus), mais il 
faut savoir que la fonction abortO restitue le comportement par defaut avant d'envoyer 
SIGABRT vers le processus appelant lui-meme. 

La routine abort( ) de la bibliotheque C est complexe, car la norme SUSv3 reclame plusieurs 
fonctionnalites assez difficiles a concilier : 

• Si le processus ignore SIGABRT, abort( ) doit reinitialiser le comportement par defaut avant 
d'envoyer ce signal. 

• Si le processus capture le signal SIGABRT et si son gestionnaire redonne ensuite la main a la 
routine abort( ), celle-ci doit vider tous les flux d' entree-sortie en utilisant f f 1 ush ( ) et les 
fermer avant de terminer le programme. 

• Si le processus capture le signal SIGABRT et s'il ne rend pas la main a abort( ), celle-ci ne 
doit pas toucher aux flux d' entree-sortie. Pour ne pas revenir, le gestionnaire peut soit sortir 
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directement du programme en appelant exit( ) ou _exit( ), soit effectuer un saut non local 
siglongjmpO vers une autre routine. 

Rajoutons a tout ceci que la routine abort () de la bibliotheque C doit traiter le cas des 
programmeurs distraits qui invoquent abort( ) depuis le gestionnaire de signaux SIGABRT lui- 
meme, ainsi que l'appel simultane depuis plusieurs threads. La complexite de cette tache est 
toutefois resolue par la routine abort( ) , dont on peut examiner 1' implementation dans les 
sources de la bibliotheque GlibC. 

Nous parlerons souvent des sauts non locaux au cours de ce chapitre. Nous les detaillerons 
lorsque nous etudierons la maniere de terminer un gestionnaire de signaux. Pour le moment, 
on peut considerer qu'il s'agit d'une sorte de « goto » permettant de sauter d'une fonction au 
sein d'une autre, en nettoyant egalement la pile. 

Signaux SIGALRM, SIGVTALRM et SIGPROF 

SIGALRM (attention a l'orthographe...) est un signal engendre par le noyau a 1' expiration du 
delai programme grace a l'appel-systeme al arm( ). Nous l'etudierons plus en detail ulterieure- 
ment car il est souvent utilise pour programmer une limite de temporisation pour des appels- 
systeme bloquants (comme une lecture depuis une connexion reseau). On programme un 
delai maximal avant d'invoquer l'appel-systeme susceptible de rester coince, et Parrivee du 
signal SIGALRM Pinterrompt, avec un code d'erreur EINTR dans errno. 

SIGALRM est egalement utilise pour la programmation de temporisations avec seti timer ( ). Cet 
appel-systeme sert a fournir un suivi temporel de Pactivite d'un processus. II y a trois types de 
temporisations : la premiere fonctionne en temps reel et declenche SIGALRM a son expiration, 
la deuxieme ne fonctionne que lorsque le processus s'execute et declenche SIGVTALRM, et la 
troisieme decompte le temps cumule d'execution du code du processus et celui du code du 
noyau execute lors des appels-systeme, puis declenche SIGPROF. L'utilisation conjointe des 
deux dernieres temporisations permet un suivi de Pactivite du processus. 

II est done formellement deconseille d'utiliser simultanement les fonctions de comptabilite de 
seti timer( ) et la programmation de al arm( ). 

Notons de surcroit que F implementation de la fonction sleepO de la bibliotheque GlibC 
utilise egalement le signal SIGALRM. Cette fonction prend bien garde de ne pas interferer avec 
les eventuelles autres routines d'alarme du processus, sauf si le gestionnaire de SIGALRM 
installe par l'utilisateur se termine par un saut non local ; dans ce cas, elle echoue. II peut 
arriver que, sur d'autres systemes, la routine si eep( ) soit moins prevenante et qu'elle inter- 
fere avec alarmO. Pour une bonne portabilite d'un programme, il vaut done mieux eviter 
d'utiliser les deux conjointement. 

SIGALRM est defini par SUSv3. SIGVTALRM et SIGPROF egalement mais sous forme d'extension 
X/Open (pas toujours disponibles dans tous les Unix). Par defaut, ces trois signaux terminent 
le processus en cours. 

Signaux SIGBUS et SIGSEGV 

Ces deux signaux indiquent respectivement une erreur d'alignement des adresses sur le bus et 
une violation de la segmentation. lis n'ont pas la me me signification mais sont generalement 
dus au meme type de bogue : l'emploi d'un pointeur mal initialise. 
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Le signal SIGBUS est dependant de l'architecture materielle car il represente en fait une refe- 
rence a une adresse memoire invalide (par exemple un mauvais alignement de mots de deux 
ou quatre octets sur des adresses paires ou multiples de quatre). 

Le signal SIGSEGV correspond a une adresse correcte mais pointant en dehors de Fespace 
d'adressage affecte au processus. 

Ces deux signaux arretent par defaut le processus en creant un fichier core. Dans un cas 
comme dans l'autre, il est mal vu d'ignorer ces types de signaux, qui sont revelateurs de 
bogues. SUSv3 souligne d'ailleurs que le comportement d'un programme ignorant SIGSEGV 
est indefini. A la rigueur, on peut capturer le signal, afficher un message a l'utilisateur et 
reprendre l'execution dans un contexte propre par un saut non local 1 ongjmp( ) , comme nous 
le decrivons ci-dessous pour SI GILL. 

Signaux SIGCHLD et SIGCLD 

Le signal SIGCHLD est emis par le noyau vers un processus dont un fils vient de se terminer ou 
d'etre stoppe. Ce processus peut alors soit ignorer le signal (ce qui est le comportement par 
defaut, mais qui est deconseille par SUSv3), soit le capturer pour invoquer l'appel-systeme 
wait( ) qui precisera le PID du fils concerne et le code de terminaison s'il s'est fini. 

Le signal SIGCLD est un synonyme de SIGCHLD sous Linux. II s'agit d'une variante historique 
sur Systeme V. Le fonctionnement de SIGCLD etait different de celui de SIGCHLD et etait parti- 
culierement discutable. Les nouvelles applications doivent done uniquement considerer 
SIGCHLD. qui est defini par SUSv3. 

Par defaut, SIGCHLD est ignore, mais ce comportement est legerement different de celui qui est 
adopte si on demande explicitement d'ignorer ce signal. Lorsqu'un processus fils se termine, 
et tant que son pere n'a pas execute un appel wait( ) , il devient zombie si SIGCHLD est capture 
par un gestionnaire ou s'il est traite par defaut. Par contre, le processus fils disparait sans 
rester a l'etat zombie si SIGCHLD est volontairement ignore. SUSv3 deconseille toutefois qu'un 
processus ignore SIGCHLD s'il est destine a avoir des descendants. Un gestionnaire de signaux 
minimal permettra d'eliminer facilement les zombies. 

Signaux SIGFPE et SIGSTKFLT 

SIGFPE correspond theoriquement a une « Floating Point Exception », mais il n'est en fait 
nullement limite aux erreurs de calcul en virgule flottante. II inclut par exemple l'erreur de 
division entiere par zero. II peut egalement se produire si le systeme ne possede pas de copro- 
cesseur arithmetique, si le noyau a ete compile sans F option pour l'emuler, et si le processus 
execute des instructions mathematiques specifiques. 

SIGFPE est defini par Ansi C et SUSv3 ; par defaut, ce signal arrete le processus en creant un 
fichier core. Une application devra done le laisser tel quel durant la phase de debogage afin de 
determiner toutes les conditions dans lesquelles il se produit (en analysant post-mortem le 
fichier core). Theoriquement, un programme suffisamment defensif ne devrait laisser passer 
aucune condition susceptible de declencher un signal SIGFPE, quelles que soient les donnees 
saisies par l'utilisateur. . . 

On notera toutefois que le debogage peut parfois etre malaise en raison du retard du signal 
provenant du coprocesseur. Le signal n'est pas necessairement delivre immediatement apres 
l'execution de la condition d'erreur, mais peut survenir apres plusieurs instructions. 
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SIGSTKFLT est un signal indiquant une erreur de pile, condition qui semble laisser les concep- 
teurs de Linux particulierement perplexes, comme en temoigne le commentaire dans /usr/ 
include/signum.h : 

#define SIGSTKFLT 16 /* ??? */ 

Ce signal, non conforme SUSv3, arrete par defaut le processus. On n'en trouve pas trace dans 
les sources du noyau, aussi est-il conseille de ne pas s'en preoccuper. 

Signal SIGHUP 

Ce signal correspond habituellement a la deconnexion {Hang Up) du terminal de controle du 
processus. Le noyau envoie SIGHUP, suivi du signal SIGCONT que nous verrons plus bas, au 
processus leader de la session associee au terminal. Ce processus peut d'ailleurs se trouver en 
arriere-plan. La gestion de ce signal se trouve dans /usr/src/l inux/dri vers /char/ tty_io. c. 

SIGHUP est aussi envoye, suivi de SIGCONT, a tous les processus d'un groupe qui devient 
orphelin. Rappelons qu'un processus cree un groupe en utilisant setpgid( ) , Fidentifiant du 
groupe etant egal au PID du processus leader. Ses descendants futurs appartiendront automa- 
tiquement a ce nouveau groupe, a moins qu'ils ne creent le leur. Lorsque le processus leader 
se termine, le groupe est dit orphelin. A ce moment, le noyau envoie SIGHUP , suivi de SIGCONT 
si le groupe contient des processus arretes. 

Enfin, il est courant d'envoyer manuellement le signal SIGHUP (en utilisant la commande /bi n/ 
kill) a certains processus demons, pour leur demander de se reinitialiser. Comme un demon 
n'a pas de terminal de controle, ce signal n'a pas de signification directe. II est alors souvent 
utilise pour demander au demon de relire ses fichiers de configuration (par exemple pour 
xinetd, named, sendmail ...). En outre ces demons ferment puis rouvrent leurs fichiers de 
journalisation (log) a la reception de ce signal ce qui permet de realiser une rotation de ces 
fichiers. 

SIGHUP est decrit par SUSv3 et, par defaut, il termine le processus cible. On notera que la 
commande nohup permet de lancer un programme en l'immunisant contre SIGHUP. En fait, 
nohup n'est pas un programme C mais un script shell utilisant la fonctionnalite TRAP de F inter- 
preter de commandes. Ce programme permet de lancer une application en arriere-plan, en 
redirigeant sa sortie vers le fichier nohup .out, et de se deconnecter en toute tranquillite. 

Signal SIGILL 

Ce signal est emis lorsque le processeur detecte une instruction assembleur illegale. Le noyau 
est prevenu par l'intermediaire d'une interruption materielle, et il envoie un signal SIGILL 
au processus fautif. Ceci ne doit jamais se produire dans un programme normal, compile pour 
la bonne architecture materielle. Mais il se peut toutefois que le fichier executable soit 
corrompu, ou qu'une erreur d' entree-sortie ait eu lieu lors du chargement du programme et 
que le segment de code contienne effectivement un code d' instruction invalide. 

Un autre probleme possible peut etre cause par les systemes a base de 386 ne disposant pas de 
coprocesseur arithmetique. Le noyau utilise alors un emulateur (wm-FPU-emu) qui peut 
declencher le signal SIGILL dans certains cas rares d' instructions mathematiques inconnues 
du 80486 de base. 
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En fait, 1' occurrence la plus courante du signal SIGI LL est revelatrice d'un bogue de deborde- 
ment de pile. Par exemple, un tableau de caracteres declare en variable locale (et done alloue 
dans la pile) peut avoir ete deborde par une instruction de copie de chaine sans limite de lon- 
gueur, comme strcpy( ). La pile peut tres bien etre corrompue, et l'execution du programme 
est totalement perturbee, avec une large confusion entre code et donnees. 

Le comportement par defaut est d'arreter le processus et de creer un fichier d' image memoire 
core. II s'agit d'un signal decrit dans la norme Ansi C. II n'est d'aucune utilite d'ignorer ce 
signal. Un programme intelligemment concu peut, en cas d'arrivee de SIGI LL . adopter Fun 
des deux comportements suivants (dans le gestionnaire de signaux) : 

• S'arreter en utilisant exitO, pour eviter de laisser trainer un fichier core qui ne sera 
d'aucune aide a l'utilisateur, apres avoir eventuellement affiche un message signalant la 
presence de bogue a l'auteur. 

• Utiliser une instruction de saut non local longjmp( ) , que nous verrons un peu plus loin. 
Cette instruction permet de reprendre le programme a un point bien defini, avec un 
contexte propre. II est toutefois preferable d'indiquer a l'utilisateur que l'execution a ete 
reprise a partir d'une condition anormale. 

Signal SIGINT 

Ce signal est emis vers tous les processus du groupe en avant-plan lors de la frappe d'une 
touche particuliere du terminal : la touche d' interruption. Sur les claviers de PC sous Linux, 
ainsi que dans les terminaux Xterm, il s'agit habituellement de Controle-C. L affectation de 
la commande d'interruption a la touche choisie peut etre modifiee par 1' intermediate de la 
commande stty, que nous detaillerons ulterieurement en etudiant les terminaux. L'affecta- 
tion courante est indiquee au debut de la deuxieme ligne en invoquant stty -al 1 : 

$ stty --all 

speed 9600 baud; rows 24; columns 80; line = 0; 

intr = A C; quit = A \; erase = A ?; kill = A U; eof = A D; eol = <undef>; 
[...] 

$ 

SIGINT est defini par la norme Ansi C et SUSv3, et arrete par defaut le processus en cours. 

Signaux SIGIO et SIGPOLL 

Ces deux signaux sont synonymes sous Linux. SIGPOLL est le nom historique sous Systeme V, 
SIGIO celui de BSD. 

SIGIO est envoye lorsqu'un descripteur de fichier change d'etat et permet la lecture ou l'ecri- 
ture. II s'agit generalement de descripteurs associes a des tubes, des sockets de connexion 
reseau, ou un terminal. La mise en place d'un gestionnaire de signaux pour SIGIO necessite 
egalement la configuration du descripteur de fichiers pour accepter un fonctionnement 
asynchrone. Nous y reviendrons dans le chapitre 30, plus precisement dans les paragraphes 
consacres aux entrees-sorties asynchrones. 

L'utilisation de SIGIO permet a un programme d'acceder a un traitement d'entree-sortie tota- 
lement asynchrone par rapport au deroulement du programme principal. Les donnees arrivant 
pourront servir par exemple a la mise a jour de variables globales consultees regulierement 
dans le cours du programme normal. II est alors important, lors de la lecture ou de l'ecriture 
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de ces variables globales par le programme normal (en dehors du gestionnaire de signaux), de 
bien bloquer le signal SIGIO durant les modifications, comme nous apprendrons a le faire dans 
le reste de ce chapitre. 

Un probleme pose par les anciennes implementations de SIGIO etait l'impossibilite de deter- 
miner automatiquement quel descripteur a declenche le signal, dans le cas oil plusieurs sont 
utilises en mode asynchrone. II fallait alors tenter systematiquement des lectures ou ecritures 
non bloquantes sur chaque descripteur, en verifiant celles qui echouent et celles qui reussis- 
sent. Ce defaut est corrige depuis Linux 2.4. 

Signal SIGKILL 

SIGKILL est Fun des deux seuls signaux (avec SIGSTOP) qui ne puisse ni etre capture ni etre 
ignore, ni meme etre temporairement bloque par un processus. A sa reception, tout processus 
est immediatement arrete. C'est une garantie pour s'assurer qu'on pourra toujours reprendre 
la main sur un programme particulierement retif. Le seul processus qui ne puisse pas recevoir 
SIGKILL est init, le processus de PID 1. 

SIGKILL est traditionnellement associe a la valeur9, d'oii la celebre ligne de commande 
kill -9 xxx, equivalente a ki 1 1 -KILL xxxx. On notera que Futilisation de SIGKI LL doit etre 
considered comme un dernier recours, le processus ne pouvant se terminer proprement. On 
preferera essayer par exemple SIGTERM auparavant, puis SIGQUIT eventuellement. 

Notons qu'un processus zombie n'est pas affecte par SIGKILL (ni par aucun autre signal 
d'ailleurs). Si un processus est stoppe, il sera relance avant d'etre termine par SIGKILL. 

Le noyau lui-meme n'envoie que rarement ce signal. C'est le cas lorsqu'un processus a 
depasse sa limite de temps d' execution, ou lors d'un probleme grave de manque de place 
memoire. La bibliotheque GlibC n'utilise ce signal que pour tuer un processus qu'elle vient 
de creer lors d'un popen ( ) et a qui elle n'arrive pas a allouer de flux de donnees. 

Signal SIGPIPE 

Ce signal est emis par le noyau lorsqu'un processus tente d'ecrire dans un tube qui n'a pas de 
lecteur. Ce cas peut aussi se produire lorsqu'on tente d'envoyer des donnees dans une socket 
TCP/IP (traitee dans le chapitre sur la programmation reseau) dont le correspondant s'est 
deconnecte. 

Le signal SIGPIPE (defini dans SUSv3) arrete par defaut le processus qui le recoit. Toute appli- 
cation qui etablit une connexion reseau doit done soit intercepter le signal, soit (ce qui est 
preferable) l'ignorer. Dans ce dernier cas en effet, les appels systeme comme write ( ) renver- 
ront une erreur EPIPE dans errno. On peut done gerer les erreurs au coup par coup des le 
retour de la fonction. Nous reviendrons sur ce probleme dans les chapitres traitant des 
communications entre processus. 

Signal SIGQUIT 

Comme SIGINT, ce signal est emis par le pilote de terminal lors de la frappe d'une touche 
particuliere : la touche QUIT. Celle-ci est affectee generalement a ControleA (ce qui necessite 
sur les claviers francais la sequence triple Ctrl-AltGr-Y). SIGQUIT termine par defaut les 
processus qui ne l'ignorent pas et ne le capturent pas. SIGQUIT engendre en plus un fichier 
d'image memoire (core). 
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Signaux SIGSTOP, SIGCONT, et SIGTSTP 

SIGSTOP est le deuxieme signal ne pouvant etre ni capture ni ignore, comme SIGKILL II a 
toutefois un effet nettement moins dramatique que ce dernier, puisqu'il ne s'agit que d'arreter 
temporairement le processus vise. Celui-ci passe a l'etat stoppe. 

Le signal SIGCONT a l'effet inverse : il permet de relancer un processus stoppe. Si le processus 
n'est pas stoppe ce signal n'a pas d'effet. Le redemarrage a toujours lieu, meme si SIGCONT est 
capture par un gestionnaire de signaux de l'utilisateur ou s'il est ignore. 

SIGTSTP est un signal ayant le meme effet que SIGSTOP, mais il peut etre capture ou ignore, et 
il est emis par le terminal de controle vers le processus en avant-plan. Lors d'un stty --all, 
la touche affectee a ce signal est indiquee par susp= et non par stop= qui correspond a un arret 
temporaire de Faffichage sur le terminal. Dans la plupart des cas, il s'agit de la touche 
Controle-Z. 

II est rare qu'une application ait besoin de capturer les signaux SIGTSTP et SIGCONT, mais cela 
peut arriver si elle doit gerer le terminal de maniere particuliere (par exemple en affichant des 
menus deroulants), et si elle desire effacer l'ecran lorsqu'on la stoppe et le redessiner 
lorsqu'elle redemarre. 

Dans la plupart des cas, on ne s'occupera pas du comportement de ces signaux. 

Signal SIGTERM 

Ce signal est une demande « gentille » de terminaison d'un processus. II peut etre ignore ou 
capture pour terminer proprement le programme en ayant effectue toutes les taches de 
nettoyage necessaires. Traditionnellement numerate 15, ce signal est celui qui est envoye par 
defaut par la commande /bin/kill. 

SIGTERM est defini par Ansi C et SUSv3. Par defaut, il termine le processus concerne. En prin- 
cipe, une application bien concue devrait installer systematiquement un gestionnaire pour 
SIGTERM et SIGINT afin d'assurer une fin « propre » au programme lorsque l'utilisateur a 
besoin de l'arreter rapidement. 

Signal SIGTRAP 

Ce signal est emis par le noyau lorsque le processus a atteint un point d'arret. SIGTRAP est 
utilise par les debogueurs comme gdb. II n'a pas d'interet pour une application classique. Le 
comportement par defaut d'un processus recevant SIGTRAP est de s'arreter avec un fichier 
core. On peut a la rigueur l'ignorer dans une application qui n'a plus besoin d'etre deboguee 
et qui ne desire pas creer de fichier core intempestif. 

Signaux SIGTTIN et SIGTTOU 

Ces signaux sont emis par le terminal en direction d'un processus en arriere-plan, qui essaye 
respectivement de lire depuis le terminal ou d'ecrire dessus. Lorsqu'un processus en arriere- 
plan tente de lire depuis son terminal de controle, tous les processus de son groupe recoivent 
le signal SIGTTIN. Par defaut, cela stoppe les processus (sans les terminer). Toutefois, il est 
possible d'ignorer ce signal ou de le capturer. Dans ce cas, l'appel systeme de lecture r ead ( ) 
echoue et renvoie un code d'erreur EIO dans errno. 
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Un phenomene assez semblable se produit dans le cas ou un processus essaye d'ecrire sur son 
terminal de controle alors qu'il se trouve en arriere-plan. Tous les processus du groupe recoi- 
vent SIGTTOU , qui les stoppe par defaut. Si ce signal est ignore ou capture, l'ecriture a quand 
meme lieu. Notons que l'interdiction d'ecrire sur le terminal par un processus en arriere-plan 
n'est valable que si l'attribut TOSTOP du terminal est actif (ce qui n'est pas le cas par defaut). 

Nous voyons ci-dessous l'exemple avec le processus /bin/Is qu'on invoque en arriere-plan. 
Par defaut, il ecrit quand meme sur le terminal. Lorsqu'on active l'attribut TOSTOP du terminal, 
/bin/1 s est automatiquement stoppe quand il tente d'ecrire. On peut le relancer en le rame- 
nant en avant-plan avec la commande f g du shell. 

$ Is & 

[1] 2839 

$ bin etc lost+found root usr 
boot home mnt sbin var 

dev lib proc tmp 
[1]+ Done Is 
$ stty tostop 
$ stty 

speed 9600 baud; line = 0; 
-brkint -imaxbel 
tostop 
$ Is & 
[1] 2842 
$ 



[1]+ Stopped (tty output) Is 
$ fg 

Is 

bin etc lost+found root usr 

boot home mnt sbin var 

dev lib proc tmp 

$ 



Signal SIGURG 

Ce signal est emis par le noyau lorsque des donnees « hors bande » arrivent sur une connexion 
reseau. Ces donnees peuvent etre transmises sur une socket TCP/IP avec une priorite plus 
grande que pour les donnees normales. Le processus recepteur est alors averti par ce signal de 
leur arrivee. Le comportement par defaut est d'ignorer ce signal. Seule une application utili- 
sant un protocole reseau assez complexe pourra avoir besoin d'intercepter ce signal. Notons 
qu'une telle application peut detecter egalement F arrivee de donnees hors bande diffe- 
remment, par le biais de l'appel systeme sel ect( ). 



Signaux SIGUSR1 et SIGUSR2 

Ces deux signaux sont a la disposition du programmeur pour ses applications. Le fait que 
seuls deux signaux soient reserves a l'utilisateur peut sembler restreint, mais cela permet deja 
d'etablir un systeme - minimal - de communications interprocessus. 

Ces deux signaux sont definis par SUSv3. Par defaut, ils terminent le processus vise, ce qui 
peut sembler discutable. 
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Signal SIG WINCH 

SIGWINCH (Window changed) indique que la taille du terminal a ete modifiee. Ce signal, ignore 
par defaut, est principalement utile aux applications se deroulant en plein ecran texte. Lorsque 
ces dernieres sont executees dans un Xterm, il est plus sympathique qu'elles se reconfigurent 
automatiquement lorsqu'on modifie la taille de la fenetre du Xterm. 

C'est par exemple le cas de l'utilitaire 1 ess , entre autres, qui intercepte SIGWINCH pour recal- 
culer ses limites d' ecran et rafraichir son affichage. 

Une application interactive plein ecran gerant ce signal beneficie d'une qualite non negli- 
geable en termes d'ergonomie utilisateur. C'est un peu le premier degre du fonctionnement 
dans un environnement graphique multifenetre. 

Par contre, la modification asynchrone des caracteristiques d' affichage peut parfois etre diffi- 
cile a implementer au niveau programmation. La methode la plus simple consiste a modifier 
un drapeau place dans une variable globale, qui sera consultee regulierement dans la boucle 
principale de fonctionnement du programme, la ou des modifications de taille d'ecran 
peuvent plus aisement etre prises en compte. 

Signaux SIGXCPU et SIGXFSZ 

Ces signaux sont emis par le noyau lorsqu'un processus depasse une de ses limites souples 
des ressources systeme. Nous verrons en detail ulterieurement, avec les appels systeme get- 
rlimitO et setrl imitO , que chaque processus est soumis a plusieurs types de limites 
systeme (par exemple le temps d'utilisation du CPU, la taille maximale d'un fichier ou de la 
zone de donnees, le nombre maximal de fichiers ouverts. . .). Pour chaque limite, il existe une 
valeur souple, modifiable par 1' utilisateur, et une valeur stricte, modifiable uniquement par 
root ou par un processus ayant la capacite CAP_SYS_RESOURCE. 

Lorsqu'un processus a depasse sa limite souple d'utilisation du temps processeur, il recoit 
chaque seconde le signal SIGXCPU. Celui-ci arrete le processus par defaut, mais il peut etre 
ignore ou capture. Lorsque le processus tente de depasser sa limite stricte, le noyau le tue avec 
un signal SIGKILL. 

SIGXFSZ fonctionne de maniere similaire et est emis par le noyau lorsqu'un processus tente de 
creer un fichier trop grand. Le signal n'est emis toutefois que si l'appel systeme write ( ) tente 
de depasser en une seule fois la taille maximale. Dans les autres cas, l'ecriture au-dela du 
seuil programme declenche une erreur EFBIG de l'appel write( ). 

Signaux temps-reel 

Les signaux temps-reel representent une extension importante apparue entre le noyau 
Linux 2.2, car ils donnent acces aux fonctionnalites definies a l'epoque par la norme Posix. lb. 
De nos jours, ils sont decrits dans l'extension RTS (real time signals) de SUSv3. Pour verifier 
F existence de ces signaux en cas de portage d'une application, on peut tester a la compilation 
la presence de la constante symbolique _POSIX_REALTIME_SIGNALS dans le fichier <uni std . h>. 

Les signaux temps-reel sont reserves a l'utilisateur : ils ne sont pas declenches par des evene- 
ments detectes par le noyau. Ce sont done des extensions de SIGUSR1 et SIGUSR2. Ils ne sont 
pas representes par des constantes, mais directement par leurs valeurs, qui s'etendent de 
SIGRTMIN a SIGRTMAX, bornes incluses. Ces signaux sont particuliers - nous y reviendrons - car 
ils sont ordonnes en fonction de leur priorite, empiles a la reception (done plusieurs signaux 
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du meme type peuvent etre recus tres rapidement), et ils fournissent au processus des infor- 
mations plus precises que les autres signaux. Nous parlerons des fonctionnalites temps-reel 
dans le chapitre 8. 

Voici done l'essentiel des signaux geres par Linux. II existe quelques signaux inutilises dans 
la plupart des cas (SIGLOST, qui surveille les verrous sur les fichiers NFS), et d'autres dont le 
comportement differe suivant F architecture materielle (SIGPWR / SIGINFO, qui previennent 
d'une chute d' alimentation electrique). 

Pour obtenir le libelle d'un signal dont le numero est connu (comme nous le ferons par la 
suite dans un gestionnaire), il existe plusieurs methodes : 

• La fonction strsignalO disponible en tant qu'extension Gnu (il faut done utiliser la 
constante symbolique _GNU_SOURCE a la compilation) dans <string.h>. Cette fonction 
renvoie un pointeur sur une chaine de caracteres allouee statiquement (done susceptible 
d'etre ecrasee a chaque appel) et contenant un libelle descriptif du signal. 

• La fonction psignal () affiche sur la sortie d'erreur standard la chaine passee en second 
argument (si elle n'est pas NULL), suivie d'un deux points et du descriptif du signal dont le 
numero est fourni en premier argument. Cette fonction est plus portable que strsignal ( ), 
elle est definie dans <si gnal . h>. 

• II existe une table globale de chaines de caracteres contenant les libelles des signaux : char 
* sys_siglist [numero_si gnal ]. 

Les prototypes de strsignal ( ) et de psignal ( ) sont les suivants : 
char * strsignal (int numero_signal ) ; 

int psignal (int numero_signal , const char * prefixe_affiche) ; 
Voici un exemple permettant de consulter les libelles. 
exemple_strsignal.c : 

#define _GNU_SOURCE 
#include <stdio.h> 
#include <stdlib.h> 
#include <signal .h> 
#include <string.h> 

int 
main (void) 
{ 

int i ; 

fprintf (stderr, "strsignalO :\n"); 
for (i = 1; i < NSIG; i ++) 

fprintf (stderr, "£s\n", strsignal (i )) ; 

fprintf (stderr, "\n sys_sigl ist[] : \n"); 
for (i = 1; i < NSIG; i ++) 

fprintf (stderr, "%d : &s\n", i, sys_siglist[i]); 

return EXIT_SUCCESS; 

} 
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Dans l'exemple d'execution ci-dessous, on remarque que strsi gnal ( ) est sensible a la locali- 
sation en cours (fr_FR). Ce n'est pas le cas pour sys_si gl ist[]. 

$ ./exemple_strsignal 

strsignalO : 

Fin de la connexion (raccroche) 

Interruption 

Quitter 

Instruction illegale 

Trappe pour point d'arrSt et de trace 

Abandon 

Erreur du bus 

Exception en point flottant 
Processus arrete 
Signal #1 defini par 1'usager 
Erreur de segmentation 
Signal #2 defini par 1'usager 
Relais brise (pipe) 
Minuterie d'alerte 
Complete 

Erreur sur la pile 

Le processus "enfant' a termine. 

Poursuite 

Signal d'arret 

Arrete 

Arrete (via 1 'entree sur tty) 
Arrete (via la sortie sur tty) 
Condition d'E/S urgente 
Temps UCT limite expire 

Debordement de la taille permise pour un fichier 
Expiration de la minuterie virtuelle 

Expiration de la minuterie durant l'etabl issement du profil 
La fenetre a change. 
E/S possible 
Panne d'al imentation 
Signal inconnu 31 
Signal de Temps-Reel 0 
Signal de Temps-Reel 1 
Signal de Temps-Reel 2 
[...] 

Signal de Temps-Reel 29 
Signal de Temps-Reel 30 
Signal de Temps-Reel 31 



sys_siglist[] : 

1 : Hangup 

2 : Interrupt 

3 : Quit 

4 : Illegal instruction 

5 : Trace/breakpoint trap 

6 : Aborted 

7 : Bus error 



136 



Programmation systeme en C sous Linux 



8 : 


Floating point exception 


9 : 


Killed 


10 


: User defined signal 1 


11 


: Segmentation fault 


12 


: User defined signal 2 


13 


: Broken pipe 


14 


: Alarm clock 


15 


: Terminated 


16 


: Stack fault 


17 


: Child exited 


18 


: Continued 


19 


: Stopped (signal) 


20 


: Stopped 


21 


: Stopped (tty input) 


22 


: Stopped (tty output) 


23 


: Urgent I/O condition 


24 


: CPU time limit exceeded 


25 


: File size limit exceeded 


26 


: Virtual timer expired 


27 


: Profiling timer expired 


28 


: Window changed 


29 


: I/O possible 


30 


: Power failure 


31 


: (null) 


32 


: (null) 


33 


: (null) 




[...] 


60 


: (null) 


61 


: (null) 


62 


: (null) 


63 


: (null) 



Nous allons a present etudier comment un signal est envoye a un processus, et sous quelles 
conditions il lui parvient. Pour l'instant, nous parlerons des signaux classiques et nous reser- 
verons les modifications concernant les signaux temps-reel au chapitre 8. 

Emission d'un signal sous Linux 

Pour envoyer un signal a un processus, on utilise l'appel systeme ki 1 1 ( ), qui est particuliere- 
ment mal nomme car il ne tue que rarement F application cible. Cet appel systeme est declare 
ainsi : 

int kill (pid_t pid, int numero_signal ) ; 

Le premier argument correspond au PID du processus vise, et le second au numero du signal 
a envoyer. Rappelons qu'il est essentiel d'utiliser la constante symbolique correspondant au 
nom du signal et non la valeur numerique directe. 

II existe une application /bi n/ ki 1 1 qui sert de frontal en ligne de commande a l'appel systeme 
ki 1 1 ( ). /bi n/ki 1 1 prend en option sur la ligne de commande un numero de signal precede 
d'un tiret « - » et suivi du ou des PID des processus a tuer. Le numero de signal peut etre 
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remplace par le nom symbolique du signal, avec ou sans le prefixe SIG. Par exemple, sur 
Linux version x86, ki 1 1 -13 1234 est equivalent a ki 1 1 -PIPE 1234. Si on ne precise pas de 
numero de signal, /bin/kil 1 utilise SIGTERM par defaut. 

En fait, le premier argument de l'appel systeme ki 1 1 ( ) peut prendre diverses valeurs : 

• S'il est strictement positif, le signal est envoye au processus dont le PID correspond a cet 
argument. 

• S'il est nul, le signal est envoye a tous les processus du groupe auquel appartient le 
processus appelant. 

• S'il est negatif, sauf pour -1, le signal est envoye a tous les processus du groupe dont le 
PGID est egal a la valeur absolue de cet argument. 

• S'il vaut-1, SUSv3 indique que le comportement est indefini. Sous Linux, le signal est 
envoye a tous les processus sur le systeme, sauf au processus i ni t (PID=1) et au processus 
appelant. Cette option est utilisee, par exemple dans les scripts de shutdown pour tuer les 
processus avant de demonter les systemes de fichiers et d'arreter le systeme (par exemple 
sur une distribution type Red Hat, on trouve ceci dans /etc/ re .d/rcO .d/S01hal t). 

Bien entendu, F emission du signal est soumise a des contraintes d'autorisation : 

• Tout d'abord, un processus ayant son UID effectif nul ou la capacite CAP_KI LL peut envoyer 
des signaux a tout processus. 

• Un processus peut envoyer un signal a un autre processus si l'UID reel ou effectif de 
l'emetteur est egal a l'UID reel ou sauve de la cible. 

• Enfin, si le signal est SIGCONT, il suffit que le processus emetteur appartienne a la meme 
session que le processus vise. 

Dans tous les autres cas, l'appel systeme ki 1 1 ( ) echoue et remplit errno avec le code EPERM. 
Si toutefois aucun processus ne correspond au premier argument - quelles que soient les auto- 
risations -, errno contiendra ESRCH. Le second argument de killO, le numero du signal a 
envoyer, doit etre positif ou nul, et inferieur a NSIG, sinon ki 1 1 ( ) renvoie l'erreur EINVAL. 

Nous voyons ici l'interet du signal numero 0. II ne s'agit pas vraiment d'un signal - rien n'est 
emis -, mais il permet de savoir si un processus est present sur le systeme. Si e'est le cas, 
l'appel systeme ki 1 1 ( ) reussira si on peut atteindre le processus par un signal, ou il echouera 
avec EPERM si on n'en a pas le droit. Si le processus n'existe pas, il echouera avec ESRCH. Voici 
par exemple un moyen de F employer : 

int 

processus_present (pid_t pid) 
{ 

if (kill (pid, 0) == 0) 

return VRAI; 
if (errno == EPERM) 

return VRAI; 
return FAUX; 

} 

Bien entendu, il est toujours possible qu'un processus qui existait encore lors de l'appel 
kill (pid, 0) se soit termine avant le re tour de cette fonction, ou que l'effet inverse se 
produise. 
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II existe une fonction de la bibliotheque C nommee rai se( ), et declaree ainsi : 

void raise (int numero_signal ) ; 

Elle est equivalente a kill (getpidO, numero_si gnal ) et permet de s'envoyer un signal. 
Cette fonction est incluse dans la norme Ansi C car elle ne necessite pas de notion de PID, a 
la difference de ki 1 1 ( ) qui elle est definie par SUSv3. 

Un processus qui s'envoie un signal a lui-meme, que ce soit par raise(num) ou par 
kill (getpid( ) , num) , est assure que le signal sera delivre avant le retour de l'appel systeme 
ki 1 1 ( ). Si le signal est capture, le gestionnaire sera execute dans tous les cas avant le retour 
de ki 1 1 ( ). Ce n'est bien entendu pas le cas lorsque le signal est destine a un autre processus. 
Le signal est mis en attente (suspendu) jusqu'a ce qu'il soit effectivement delivre au 
processus vise. 

II existe egalement une fonction de bibliotheque nommee ki 1 1 pg( ) permettant d'envoyer un 
signal a un groupe de processus. Elle est declaree ainsi : 

int kill pg ( pi d_t pgid, int numero_signal ) 

Si le pgid indique est nul, elle envoie le signal au groupe du processus appelant. Comme on 
pouvait s'y attendre, elle fait directement appel a kill (-pgid, numero_signal ) apres avoir 
verifie que pgid est positif ou nul. Un tel appel systeme est interessant car il peut detruire 
automatiquement tous ses descendants en se terminant. Pour cela, il suffit que le processus 
initial cree son propre groupe en invoquant setpgrp( ) , et il pourra tuer tous ses descendants 
en appelant ki 1 1 pg(getpgrp( ) , SIGKILL) avant de se finir. 

L' emission des signaux est, nous le voyons, une chose assez simple et portable. Nous allons 
observer comment le noyau se comporte pour delivrer un signal en fonction de Faction 
programmed par le processus. 

Delivrance des signaux - Appels systeme lents 

Un processus peut bloquer temporairement un signal. Si celui-ci arrive pendant ce temps, il 
reste en attente jusqu'a ce que le processus le debloque. II est bien sur impossible de bloquer 
SIGKILL ou SIGSTOP. Le fait de bloquer un signal permet de proteger des parties critiques du 
code, par exemple Faeces a une variable globale modifiee egalement par le gestionnaire du 
signal en question. 

Les concepteurs de Linux 2.0 avaient choisi de representer la liste des signaux en attente pour 
une tache par un masque de bits contenu dans un entier long. Chaque signal correspondait 
done a un bit precis. Depuis Linux 2.2 a ete introduit le concept des signaux temps-reel, pour 
lesquels il existe une file d' attente des signaux. Un meme signal temps-reel peut done etre en 
attente en plusieurs occurrences. La representation interne des signaux en attente a done ete 
modifiee pour devenir une table. 

Un processus possede egalement un masque de bits indiquant quels sont les signaux bloques. 
Lorsqu'un processus recoit un signal bloque, ce dernier reste en attente jusqu'a ce que le 
processus le debloque. Les signaux classiques ne sont pas empiles, ce qui signifie qu'une 
seule occurrence d'un signal donne est conservee lorsque plusieurs exemplaires arrivent 
consecutivement alors que le signal est bloque. Les signaux temps-reel sont par contre 
empiles, ce qui veut dire que le noyau conserve Fensemble des exemplaires d'un signal arrive 
alors qu'il est bloque. 
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Le travail du noyau commence done a partir de la fonction ki 1 1 ( ) interne se trouvant dans 
/usr/src/1 inux/kernel /si gnal .c. Le noyau analyse le masque des signaux bloques du 
processus vise. Si le signal est bloque, il est done simplement inscrit dans la liste en attente. 
Si le signal n'est pas bloque et si le processus cible est interruptible, ce dernier est alors 
reveille. 

A son reveil, le processus traite la liste des signaux en attente non bloques. Un signal ignore 
est simplement ehrnine, sauf SIGCHLD, pour lequel le systeme execute en plus une boucle 

while (waitpid(-l, NULL, WNOHANG) > 0) 
/* rien */; 

pour eliminer les zombies. 

Le systeme assure ensuite la gestion des signaux dont le comportement est celui par defaut 
(ignorer, stopper, arreter, creer un fichier core). Sinon, il invoque le gestionnaire de signaux 
installe par l'utilisateur. 

II existe sous Unix des appels systeme rapides et des appels systeme lents. Un appel rapide ne 
peut pas etre interrompu (hormis par une commutation de tache de l'ordonnanceur). Par 
contre, un appel lent peut rester bloque pendant une duree indeterminee. Savoir si un appel 
systeme est rapide ou lent n'est pas toujours simple. Classiquement, tous les appels concer- 
nant des descripteurs de fichiers (open, read, wri te, f cntl . . .) peuvent etre lents des lors qu'ils 
travaillent sur une socket reseau, un tube, voire des descripteurs de terminaux. Bien entendu, 
les appels systeme d'attente comme waitO, selectO, pollO ou pauseO peuvent attendre 
indefiniment. Certains appels systeme servant aux communications interprocessus, comme 
semop( ) qui gere des semaphores ou msgsnd( ) et msgrcv( ) qui permettent de transmettre des 
messages, peuvent rester bloques au gre du processus correspondant. 

Prenons l'exemple d'une lecture depuis une connexion reseau. Lappel systeme readO est 
alors bloque aussi longtemps que les donnees se font attendre. Si un signal non bloque, pour 
lequel un gestionnaire a ete installe, arrive pendant un appel systeme lent, ce dernier est inter- 
rompu. Le processus execute alors le gestionnaire de signaux. A la fin de F execution de celui- 
ci (dans le cas ou il n'a pas mis fin au programme ni execute de saut non local), il y a plusieurs 
possibilites. 

Le noyau peut faire echouer l'appel interrompu, qui transmet alors le code d'erreur EINTR 
dans errno. Le programme utilisateur devra alors reessayer son appel. Ceci implique d'enca- 
drer tous les appels systeme lents avec une gestion du type : 

do { 

nb_lus = read(socket_rcpt, buffer, nb_octets_a_l i re) ; 
} (while ((nbjus == -1) && (errno == EINTR)); 

Ceci est tout a fait utilisable si, dans les portions de code oil des signaux sont susceptibles de 
se produire, on utilise peu d' appels systeme lents. Notons d'ailleurs que les fonctions de la 
bibliotheque C, par exemple f read( ), gerent elles-memes ce genre de cas. 

En outre, le fait de faire volontairement echouer une lecture est un moyen d'eviter un blocage 
definitif, en utilisant un delai maximal par exemple. L'appel systeme al arm( ), qui declenche 
un signal SIGALRM lorsque le delai prevu est ecoule, est bien sur le plus couramment utilise. 

al armtdel ai_maxiirial_en_secondes ) ; 

nb_lus = read(socket_rcpt, buffer, nb_octets_a_l i re) ; 

alarm(O); /* arreter la tempo si pas ecoulee entierement */ 
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if (nb_lus != nb_octets_a_l i re) { 
if (errno == EINTR) 

/* Del ai depasse. . . */ 

Ce code est tres imparfait ; nous en verrons d'autres versions quand nous etudierons plus en 
detail l'alarme. De plus, nous ne savons pas quel signal a interrompu l'appel systeme, ce n'est 
pas necessairement SIGALRM. 

II faut alors tester tous les retours de fonctions du type readO ou writeO, et les relancer 
eventuellement si le signal recu n'a pas d'influence sur le travail en cours. C'est d'autant plus 
contraignant avec le developpement des applications fonctionnant en reseau, ou une grande 
partie des appels systeme autrefois rapides - read( ) depuis un fichier sur disque - peuvent 
bloquer longuement, le temps d'interroger un serveur distant. La surcharge en termes de code 
necessaire pour encadrer tous les appels systeme susceptibles de bloquer est parfois assez 
lourde. 

Une autre possibilite, introduite initialement par les systemes BSD, est de demander au noyau 
de relancer automatiquement les appels systeme interrompus. Ainsi, le code utilisant read( ) 
ne se rendra pas compte de l'arrivee du signal, le noyau ayant fait redemarrer l'appel systeme 
comme si de rien n'etait. L'appel read( ) ne renverra jamais plus l'erreur EINTR. 

Cela peut se configurer aisement, signal par signal. II est done possible de demander que 
tous les signaux pour lesquels un gestionnaire est fourni fassent redemarrer automatiquement 
les appels systeme interrompus, a l'exception par exemple de SIGALRM qui peut servir a 
programmer un delai maximal. Dans l'exemple precedent, la lecture reprendra automatique- 
ment et ne se terminera que sur une reussite ou une reelle condition d'erreur, sauf bien 
entendu si on la temporise avec al arm( ). 

Nous allons a present etudier le moyen de configurer le comportement d'un processus a la 
reception d'un signal precis. 

Reception des signaux avec l'appel systeme signal() 

Un processus peut demander au noyau d' installer un gestionnaire pour un signal particulier, 
e'est-a-dire une routine specifique qui sera invoquee lors de l'arrivee de ce signal. Le 
processus peut aussi vouloir que le signal soit ignore lorsqu'il arrive, ou laisser le noyau 
appliquer le comportement par defaut (souvent une terminaison du programme). 

Pour indiquer son choix au noyau, il y a deux possibilites : 

• L'appel-systeme signal (), defini par Ansi C et SUSv3, presente l'avantage d'etre tres 
simple (on installe un gestionnaire en une seule ligne de code), mais il peut parfois poser 
des problemes de fiabilite de delivrance des signaux et de compatibilite entre les divers 
systemes Unix. 

• L'appel-systeme sigactiont ) est legerement plus complexe puisqu'il implique le remplis- 
sage d'une structure, mais il permet de definir precisement le comportement desire pour le 
gestionnaire, sans ambiguite suivant les systemes puisqu'il est completement defini par 
SUSv3. 

Nous allons tout d'abord voir la syntaxe et l'utilisation de signal (), car il est souvent 
employe, puis nous etudierons dans le prochain chapitre sigaction( ) , qui est generalement 
plus adequat pour controler finement le comportement d'un programme. Notons au passage 
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l'existence d'une ancienne fonction, sigvecO, obsolete de nos jours et approximativement 
equivalente a sigactionO. 

L'appel systeme signal ( ) presente un prototype qui surprend toujours au premier coup d'ceil, 
alors qu'il est extremement simple en realite : 

void (*signal (int numero_signal , void (*gestionnai re) (int))) (int); 

II suffit en fait de le decomposer, en creant un type intermediate correspondant a un pointeur 
sur une routine de gestion de signaux : 

typedef void (*gestion_t)(int) ; 

et le prototype de si gnal ( ) devient : 

gestion_t signal (int numero_signal , gestion_t gestionnaire); 

En d'autres termes, signal ( ) prend en premier argument un numero de signal. Bien entendu, 
il faut utiliser la constante symbolique correspondant au nom du signal, jamais la valeur 
numerique directe. Le second argument est un pointeur sur la routine qu'on desire installer 
comme gestionnaire de signaux. L'appel systeme nous renvoie un pointeur sur l'ancien 
gestionnaire, ce qui permet de le sauvegarder pour eventuellement le reinstaller plus tard. 

II existe deux constantes symboliques qui peuvent remplacer le pointeur sur un gestionnaire, 
SIG IGN et S I G D F L , qui sont definies dans <signal .h>. 

La constante SIG_IGN demande au noyau d'ignorer le signal indique. Par exemple l'appel 
systeme signal (SIGCHLD, S I G_I GN ) - deconseille par SUSv3 - a ainsi pour effet sous Linux 
d'eliminer directement les processus fils qui se terminent, sans les laisser a l'etat zombie. 

Avec la constante SIG_DFL, on demande au noyau de reinstaller le comportement par defaut 
pour le signal considere. Nous avons vu l'essentiel des actions par defaut. Elles sont egale- 
ment documentees dans la page de manuel si gnal ( 7 ). 

Si l'appel systeme signal ( ) echoue, il renvoie une valeur particuliere, elle aussi est definie 
dans <signal .h> : SIG_ERR. 

L'erreur positionnee dans errno est alors generalement EINVAL, qui indique un numero de 
signal inexistant. Si on essaie d'ignorer ou d'installer un gestionnaire pour les signaux 
SIGKILL ou SIGSTOP, F operation n'a pas lieu. La documentation de la fonction signal ( ) de 
GlibC indique que la modification est silencieusement ignoree, mais en realite l'appel 
systeme sigaction( ) - interne au noyau -, sur lequel cette fonction est batie, renvoie EINVAL 
dans errno dans ce cas. 

L'erreur E FAULT peut aussi etre renvoyee dans errno si le pointeur de gestionnaire de signaux 
n'est pas valide. 

Un gestionnaire de signaux est une routine comme les autres, qui prend un argument de type 
entier et qui ne renvoie rien. L argument transmis correspond au numero du signal ay ant 
declenche le gestionnaire. II est done possible d'ecrire un unique gestionnaire pour plusieurs 
signaux, en repartissant les actions a l'aide d'une construction switch-case. 

II arrive que le gestionnaire de signaux puisse recevoir d'autres informations dans une struc- 
ture transmise en argument supplementaire (comme le PID du processus ayant envoye le 
signal). Cette fonctionnalite est disponible depuis Linux 2.2. Pour cela, il faut installer neces- 
sairement le gestionnaire avec l'appel systeme sigaction( ) que nous verrons plus bas. 
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Le gestionnaire de signaux etant une routine sans specificite, il est possible de Finvoquer 
directement dans le corps du programme si le besoin s'en fait sentir. 

Nous allons pouvoir installer notre premier gestionnaire de signaux. Nous allons tenter de 
capturer tous les signaux. Bien entendu, signal () echouera pour SIGKILL et SIGSTOP. Pour 
tous les autres signaux, notre programme affichera le PID du processus en cours, suivi du 
numero de signal et de son nom. II faudra disposer d'une seconde console (ou d'un autre 
Xterm) pour pouvoir tuer le processus a la fin. 

exemple_signal.c : 

#include <stdio.h> 

#include <stdlib.h> 

#incl ude <signal .h> 

#include <unistd.h> 

void 

gestionnaire (int numero_signal ) 
{ 

fprintf (stdout, "\n %~\d a recu le signal %d Us)\n", 

(long) getpidO, numero_signal , sys_siglist[numero_signal]); 

} 



int 
main (void) 
{ 

int i ; 



for (i = 1; i < NSIG; i ++) 

if (signal (i, gestionnaire) == SIG_ERR) 

fprintf (stderr, "Signal %d non capture \n", i); 
while (1) 

pause( ) ; 



return EXIT_SUCCESS ; 

} 

Voici un exemple d'execution avec, en seconde colonne, Taction effectuee sur un autre 
terminal : 

$ ./exemple_signal 

Signal 9 non capture 
Signal 19 non capture 

(Controle-C) 
6240 a recu le signal 2 (Interrupt) 

(Controle-Z) 
6240 a recu le signal 20 (Stopped) 

(Contr61e-\) 
6240 a recu le signal 3 (Quit) 

$ kill -TERM 6240 

6240 a recu le signal 15 (Terminated) 

$ kill -KILL 6240 

Ki 1 1 ed 
$ 
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On appuie sur les touches de controle sur la console du processus exempl e_signal, alors que 
les ordres ki 1 1 sont envoyes depuis une autre console. Le signal 9 non capture correspond a 
SIGKILL, et le 19 a SIGSTOP. 

Ce programme a egalement un comportement interessant vis-a-vis du signal SIGSTOP, qui le 
stoppe temporairement. Le shell reprend alors la main. Nous pouvons toutefois ramener 
le processus en avant-plan, ce qui lui transmet le signal SIGCONT : 

$ . /exempl e_signal 

Signal 9 non capture 
Signal 19 non capture 

(Controle-C) 
6241 a recu le signal 2 (Interrupt) 

$ kill -STOP 6241 

[1]+ Stopped (signal) . /exempl e_signal 
$ ps 6241 

PID TTY STAT TIME COMMAND 
6241 p5 T 0:00 . /exempl e_si gnal 
$ fg 

. /exempl e_si gnal 

6241 a recu le signal 18 (Continued) 

(Contr61e-\) 
6241 a recu le signal 3 (Quit) 

$ kill -KILL 6241 

Killed 
$ 

Le champ STAT de la commande ps contient T, ce qui correspond a un processus stoppe ou 
suivi (traced). 

II faut savoir que sous Linux, la constante symbolique S I G_D F L est definie comme valant 0 
(c'est souvent le cas, meme sur d'autres systemes Unix). Lors de la premiere installation d'un 
gestionnaire, l'appel systeme si gnal () renvoie done, la plupart du temps, cette valeur (a 
moins que le shell n'ait modifie le comportement des signaux auparavant). II y a la un risque 
d'erreur pour le programmeur distrait qui peut ecrire machinalement : 

if (signaK...) != 0) 
/* erreur */ 

comme on a l'habitude de le faire pour d'autres appels systeme. Ce code fonctionnera a la 
premiere invocation, mais echouera par la suite puisque si gnal () renvoie l'adresse de 
Fancien gestionnaire. Ne pas oublier, done, de detecter les erreurs ainsi : 

if (signaK...) == SIG_ERR) 
/* erreur */ 

Nous avons pris soin dans 1' execution de l'exemple precedent de ne pas invoquer deux fois de 
suite le meme signal. Pourtant, cela n'aurait pas pose de probleme avec Linux et la GlibC, 
comme en temoigne l'essai suivant : 

$ . /exempl e_si gnal 

Signal 9 non capture 
Signal 19 non capture 

(Controle-C) 
6743 a regu le signal 2 (Interrupt) 
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(Controle-C) 

6743 a regu le signal 2 (Interrupt) 

(Controle-C) 
6743 a regu le signal 2 (Interrupt) 

(Controle-Z) 
6743 a regu le signal 20 (Stopped) 

(Controle-Z) 
6743 a regu le signal 20 (Stopped) 

$ kill -KILL 6743 

Ki 1 1 ed 
$ 

II existe toutefois de nombreux systemes Unix (de la famille Systeme V) sur lesquels un 
gestionnaire de signaux ne reste pas en place apres avoir ete invoque. Une fois que le signal 
est arrive, le noyau repositionne le comportement par defaut. Ce dernier peut etre observe 
sous Linux avec GlibC en definissant la constante symbolique _X0PEN_S0URCE avant d'inclure 
<s i gnal . h>. En voici un exemple : 

exemple_signal_2.c : 

//define _X0PEN_SOURCE 
#include <stdio.h> 
include <stdlib.h> 
//include <unistd.h> 
//include <signal .h> 

void 

gestionnaire (int numero_signal ) 
{ 

fprintf (stdout, "\n £ld a regu le signal £d\n", (long) getpid (), 
numero_signal ) ; 

} 

int 
main (void) 
{ 

int i ; 

for (i = 1; 1 < _NSIG; i ++) 

if (signaKi, gestionnaire) == SIG_ERR) 

fprintf (stderr, "£ld ne peut capturer le signal £d\n", 
(long) getpidO, i); 

while (1) 
pause( ) ; 

return EXIT_SUCCESS; 

} 

Voici un exemple d'execution dans lequel on remarque que la premiere frappe de Controle-Z 
est interceptee, mais pas la seconde, qui stoppe le processus et redonne la main au shell. On 
redemarre alors le programme avec la commande f g, et on invoque Controle-C. Sa premiere 
occurrence sera bien interceptee, mais pas la seconde. 



Gestion classique des signaux 




Chapitre 6 



$ . /exempl e_signal_2 

6745 ne peut capturer le signal 9 
6745 ne peut capturer le signal 19 

(Controle-Z) 
6745 a recu le signal 20 

(Controle-Z) 
[1]+ Stopped ./exemple_signal_2 
$ ps 6745 

PID TTY STAT TIME COMMAND 
6745 p5 T 0:00 . /exempl e_si gnal_2 
$ fg 

. /exempl e_signal_2 

6745 a recu le signal 18 

(Controle-C) 
6745 a recu le signal 2 

(Controle-C) 

$ 

Le signal 18 correspond a SIGCONT, que le shell a envoye en replant le processus en avant- 
plan. Sur ce type de systeme, il est necessaire que le gestionnaire de signaux s'installe a 
nouveau a chaque interception d'un signal. On doit done utiliser un code du type : 

int 

gestionnaire (int numero_signal ) 
{ 

signal (numero_signal , gestionnaire) ; 

/* Traitement effectif du signal recu */ 

} 

II est toutefois possible que le signal arrive de nouveau avant que le gestionnaire ne soit reins- 
talle. Ce type de comportement a risque conduit a avoir des signaux non fiables. 

Un deuxieme probleme se pose avec ces anciennes versions de si gnal ( ) pour ce qui concerne 
le blocage des signaux. Lorsqu'un signal est capture et que le processus execute le gestion- 
naire installe, le noyau ne bloque pas une eventuelle occurrence du meme signal. Le ges- 
tionnaire peut alors se trouver rappele au cours de sa propre execution. Nous allons le demon- 
trer avec ce petit exemple, dans lequel un processus fils envoie deux signaux a court intervalle 
a son pere, lequel utilise un gestionnaire lent, qui compte jusqu'a 3. 

exemple_signal_3.c : 

#define _X0PEN_S0URCE 
#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <signal .h> 



void 

gestionnaire (int numero_signal ) 



int i ; 

signal (numero_signal , gestionnai re) ; 
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fprintf (stdout, "debut du gestionnai re de signaux %A \n", 

numero_signal ) ; 
for (i = 1; 1 < 4; i ++) { 

fprintf (stdout, "£d\n", i); 

sleep(l) ; 

} 

fprintf (stdout, "fin du gestionnaire de signaux £d\n", numero_signal ) ; 

} 

int 
main (void) 
{ 

signal (SIGUSR1, gestionnaire); 
if (forkO == 0) { 

kilKgetppidO, SIGUSR1); 

sleep(l) ; 

kilKgetppidO, SIGUSR1 ) ; 
} else { 

while (1) 
pause( ) ; 

} 

return EXIT_SUCCESS; 

} 

Voici ce que donne 1' execution de ce programme : 

$ ./exemple_signal_3 

debut du gestionnaire de signaux 10 
1 

debut du gestionnaire de signaux 10 

1 

2 

3 

fin du gestionnaire de signaux 10 

2 

3 

fin du gestionnaire de signaux 10 
(Controle-C) 

$ 

Les deux comptages sont enchevetres, ce qui n'est pas grave car la variable 1 est allouee de 
maniere automatique dans la pile, et il y a done deux compteurs differents pour les deux invo- 
cations du gestionnaire. Mais cela pourrait se passer autrement si la variable de comptage 
etait statique ou globale. II suffit de deplacer le i nt i pour le placer en variable globale avant 
le gestionnaire, et on obtient l'execution suivante : 

$ ./exemple_signal_3 

debut du gestionnaire de signaux 10 
1 

debut du gestionnaire de signaux 10 

1 

2 

3 
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fin du gestionnai re de signaux 10 
fin du gestionnaire de signaux 10 
(Controle-C) 

Cette fois-ci, le compteur global etait deja arrive a 4 lorsqu'on est revenu dans le premier 
gestionnaire, celui qui avait lui-meme ete interrompu par le signal. Pour eviter ce genre de 
desagrement, la version moderne de signal (), disponible sous Linux, bloque automati- 
quement un signal lorsqu'on execute son gestionnaire, puis le debloque au retour. On peut 
le verifier en supprimant la ligne #define _X0PEN_S0URCE et on obtient (meme en laissant le 
compteur en variable globale) : 

$ ./exemple_signal_3 

debut du gestionnaire de signaux 10 

1 

2 

3 

fin du gestionnaire de signaux 10 
debut du gestionnaire de signaux 10 
1 

2 
3 

fin du gestionnaire de signaux 10 
(Controle-C) 

$ 

Comme on pouvait s'y attendre, les deux executions du gestionnaire de signaux sont sepa- 
rees. On peut noter au passage que si on rajoute un troisieme 

sleep(l); 

kilKgetppidO, SIGUSR1); 

dans le processus fils, il n'y a pas de difference d'execution. Seules deux executions du 
gestionnaire ont lieu. C'est du au fait que, sous Linux, les signaux classiques ne sont pas 
empiles, et l'arrivee du troisieme SIGUSR1 se fait alors que le premier gestionnaire n'est 
pas termine. Aussi, un seul signal est mis en attente. Remarquons egalement que lorsqu'on 
elimine la definition _X0PEN_S0URCE, on peut supprimer l'appel signal () a l'interieur du 
gestionnaire : celui-ci est automatiquement reinstalle, comme on l'a deja indique. 

Bien sur, toutes ces experimentations tablent sur le fait que F execution des processus se fait 
de maniere homogene, sur un systeme peu charge. Si tel n'est pas le cas, les temps de commu- 
tation entre les processus pere et fils, ainsi que les delais de delivrance des signaux, peuvent 
modifier les comportements de ces exemples. 

Nous voyons que la version de signal ( ) disponible sous Linux, heritee de celle de BSD, est 
assez performante et fiable puisqu'elle permet, d'une part, une reinstallation automatique du 
gestionnaire lorsqu'il est invoque et, d' autre part, un blocage du signal concerne au sein de 
son propre gestionnaire. Une derniere question se pose, qui concerne le redemarrage automa- 
tique des appels systeme lents interrompus. 

Pour cela, la bibliotheque GlibC nous offre une fonction de controle nommee siginter- 
ruptO. 

int siginterrupt (int numero, int interrompre) ; 
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Elle prend en argument un numero de signal, suivi d'un indicateur booleen. Elle doit etre 
appelee apres l'installation du gestionnaire et, si Findicateur est mil, les appels systeme lents 
seront relances automatiquement. Si 1' indicateur est non nul, les appels systeme echouent, 
avec une erreur EINTR dans errno. 

Voici un petit programme qui prend une valeur numerique en argument et la transmet a sig- 
interruptO apres avoir installe un gestionnaire pour le signal TSTP (touche Controle-Z). II 
execute ensuite une lecture bloquante depuis le descripteur de fichier 0 (entree standard). Le 
programme nous indique a chaque frappe sur Controle-Z si la lecture est interrompue ou non. 
On peut terminer le processus avec Controle-C. 

exemple_siginterrupt.c : 

#include <stdio.h> 
#include <stdlib.h> 
#1nclude <unistd.h> 
#include <errno.h> 

#1nclude <signal .h> 



void 

gestionnaire (int numero_signal ) 
{ 

fprintf (stdout, "\n gestionnaire de signaux M\n", numero_signal ) ; 

} 

int 

main (int argc, char * argv []) 
{ 

int i ; 

if ((argc != 2) || (sscanf (argv[l] , "Zd", & i) != 1) ) { 
fprintftstderr, "Syntaxe : Is { 0 1 1 } \ n " , argv [0]); 
exit ( EXIT_FAI LURE ) ; 

} 

signal (SIGTSTP, gestionnaire); 
siginterrupttSIGTSTP, i); 

while (1) { 

fprintf (stdout, "appel read()\n"); 
if (read(0, &i , sizeof (int)) < 0) 
if (errno == EINTR) 

fprintf (stdout, "EINTR \n"); 

} 

return EXIT_SUCCESS; 

} 

Voici un exemple d' execution : 

$ ./exemple_siginterrupt 0 
appel readO 
(Controle-Z) 
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gestionnai re de signaux 20 

(Controle-Z) 
gestionnai re de signaux 20 

(Controle-C) 
$ ./exemple_siginterrupt 1 
appel readO 

(Controle-Z) 
gestionnaire de signaux 20 
EINTR 

appel readO 

(Controle-Z) 
gestionnaire de signaux 20 
EINTR 

appel readO 
(Controle-C) 

$ 

En supprimant la ligne siginterrupt( ), on peut s'apercevoir que le comportement est iden- 
tique a « exemple_siginterrupt 0 ». Les appels systeme lents sont done relances automati- 
quement sous Linux par defaut. Si, par contre, nous definissons la constante _X0PEN_S0URCE 
comme nous l'avons fait precedemment, en supprimant la ligne siginterrupt( ), on observe 
que les appels lents ne sont plus relances. 



Conclusion 

Nous voyons done que l'appel systeme signal ( ) donne acces, sous Linux, avec la bibliotheque 
GlibC, a des signaux fiables. Nous pouvons aussi compiler des sources datant d'anciens 
systemes Unix et se fondant sur un comportement moins fiable de si gnal ( ) , simplement en 
definissant des constantes symboliques a la compilation (consulter a ce sujet le fichier /usr/ 
include/features. h). 

Malheureusement, ce n'est pas le cas sur tous les systemes, aussi est-il preferable d' employer 
la fonction sigaction( ) , que nous allons etudier dans le prochain chapitre et qui permet un 
parametrage plus souple du comportement du programme. 

L'appel si gnal () doit surtout etre reserve aux cas ou Ton desire ignorer un signal ou lui 
rendre son comportement par defaut. Pour installer un gestionnaire dans une application 
portable, on preferera sigaction( ). 
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La gestion des signaux de maniere portable n'est pas beaucoup plus compliquee que ce que 
nous avons vu dans le chapitre precedent. L'appel-systeme sigactionO que nous allons 
etudier tout d'abord permet de realiser toutes les operations de configuration du gestionnaire 
et du comportement des signaux. 

Nous examinerons ensuite le principe des ensembles de signaux, qui permettent d' assurer les 
blocages temporaires avec si gprocmask( ). Enfin nous observerons les « bonnes manieres » 
d'ecrire un gestionnaire de signaux, ce que nous mettrons en pratique avec une etude de 
Falarme SIGALRM. 

Reception des signaux avec l'appel-systeme sigaction() 

La routine sigactionO prend trois arguments et renvoie un entier valant 0 si elle reussit, et -1 
si elle echoue. Le premier argument est le numero du signal (comme toujours, il faut utiliser 
la constante symbolique definissant le nom du signal). Les deux autres arguments sont des 
pointeurs sur des structures sigaction (pas d'inquietude, il n'y a pas d'ambiguite avec le nom 
de la routine dans la table des symboles du compilateur). Ces structures definissent precise- 
ment le comportement a adopter en cas de reception du signal considere. Le premier pointeur 
est le nouveau comportement a programmer, alors que le second pointeur sert a sauvegarder 
Fancienne action. Le prototype est done le suivant : 

int sigaction (int numero, 

const struct sigaction * nouvelle, 
struct sigaction * ancienne); 

Si le numero indique est inferieur ou egal a 0, superieur ou egal a NSIG, ou egal a SIGKI LL ou 
SIGSTOP, sigacti on( ) echoue en placant EINVAL dans errno. 
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Si le pointeur sur la nouvelle structure sigaction est NULL, aucune modification n'a lieu, seul 
l'ancien comportement est sauvegarde dans le second pointeur. Parallelement, si le pointeur 
sur Fancienne structure est NULL, aucune sauvegarde n'a lieu. 

Voyons maintenant le detail de la structure si gacti on. Celle-ci est definie dans <si gacti on . h> 
qui est inclus par <s i gnal .h> : 



Nom 


Type 


sa_handl er 


sighandler_t 


sa_mask 


sigset_t 


sa_fl ags 


int 


sa_restorer 


void (*) (void) 




Attention 

L'ordre des membres de cette structure n'est pas fixe suivant les systemes, et il a change entre differentes 
versions du noyau Linux. II ne faut done surtout pas le considerer comme immuable et eviter par exemple 
d'initialiser la structure de maniere statique. 



Le premier membre de cette structure correspond a un pointeur sur le gestionnaire du signal, 
comme nous en transmettions a l'appel-systeme signal ( ). Le champ sa_handler peut egale- 
ment prendre comme valeur SIG_IGN pour ignorer le signal ou S I G_D F L pour appliquer Taction 
par defaut. Un gestionnaire doit done etre defini ainsi : 

void gestionnaire_signal (int numero); 

Le second membre est du type sigsetjt, e'est-a-dire un ensemble de signaux. Nous verrons 
plus bas des fonctions permettant de configurer ce type de donnees. Cet element correspond a 
la liste des signaux qui sont bloques pendant F execution du gestionnaire. Le signal ayant 
declenche l'execution du gestionnaire est automatiquement bloque, sauf si on demande expli- 
citement le contraire (voir ci-dessous SA_NODEFER). Une tentative de blocage de SIGKILL ou 
SIGCONT est silencieusement ignoree. 

Enfin, le troisieme membre sa_flags contient un OU binaire entre differentes constantes 
permettant de configurer le comportement du gestionnaire de signaux : 





Nom 


Signification 


SA_ 


.NOCLDSTOP 


Cette constante ne concerne que le gestionnaire pour le signal SIGCHLD. Lorsqu'elle est presente, 
ce gestionnaire n'est pas invoque lorsqu'un processus fils a ete stoppe temporairement (avec le 
signal SIGSTOP ou SIGTSTP). Par contre, il sera appele pour les processus fils qui se terminent 
definitivement. Pour tout autre signal que SIGCHLD, cette constante est ignoree. 


SA_ 


.RESTART 


Lorsqu'elle est presente, cette constante indique que les appels systeme lents interrompus par le 
signal concerne sont automatiquement redemarres. On I'utilise generalement pour tous les signaux, 
sauf pour SIGALRM s'il sert a installer un delai maximal pour une fonction pouvant rester bloquee. 


SA_ 


.INTERRUPT 


Cette constante n'est pas definie par SUSv3. Elle a le comportement exactement inverse de SA_ 
RESTART, en empechant le redemarrage automatique des appels systeme interrompus. II suffit, 
pour porter sous Linux des programmes utilisant cette valeur, de la supprimer (eventuellement 
avec un #def ine SA_INTERRUPT 0) et de ne pas utiliser la constante SA_RESTART dans ce cas. 
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Norn 


Signification 


SA_ 


.NODEFER 


Demande explicitement qu'un signal ne soit pas bloque a I'interieur de son propre gestionnaire. 
En realite, sous Linux, elle est identique a SA_N0MASK, constante qui empeche de bloquer les 
signaux mentionnes dans sa_mask. Sa portee est done plus grande. Si on desire obtenir le 
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I'ensemble de signaux de sa_mask. 


SA_ 


.RESETHAND 


Lorsqu'un gestionnaire de signaux est invoque et que cette constante a ete fournie a sig- 
actiont), le comportement par defaut est reinstalle pour le signal concerne. C'etait le compor- 
tement normal des premieres versions de signal (), ce que nous avions force avec la constante 
_X0PEN_S0URCE dans notre programme exemple_signal_2.c. 


SA_ 


.ONESHOT 


Cette constante n'est pas definie par SUSv3. Elle est equivalents a SA_RESETHAND. 


SA_ 


.SIGINFO 


II s'agit d'une valeur decrite par SUSv3 pour les signaux temps-reel, mais qui peut etre utilisee 
aussi pour les signaux classiques. 

Un gestionnaire de signaux installe avec cette option recevra des informations supplementaires, 
en plus du numero du signal qui I'a declenche. Le gestionnaire doit accepter trois arguments : le 
premier est toujours le numero du signal, le second est un pointeur sur une structure de type 
siginfo_t, le troisieme argument, de type void *, n'est pas documents dans les sources du 
noyau. 

Nous detaillerons cette possibilite plus bas. 


SA_ 


.ONSTACK 


Dans ce cas, le gestionnaire du signal en question utilise une pile differente de celle du reste du 
programme. Nous fournirons plus loin un exemple d'utilisation de cette possibilite. 



Lorsqu'on utilise l'attribut SA_S I GI N FO, on considere que la structure sigaction contient un 
champ supplementaire, nomme sa_s i gacti on, permettant de stocker le pointeur sur le gestion- 
naire. En realite, tout est souvent implemente sous forme d'union, une seule et meme zone 
servant a stocker l'adresse des differents types de gestionnaires, mais les prototypes differents 
permettant une verification a la compilation. Cela signifie aussi que les noms des membres 
presents dans la structure sigaction peuvent etre en realite des macros permettant d'acceder 
a des champs dont le nom est plus complexe, et qu'il faut eviter, sous peine de voir le compi- 
lateur echouer, d'appeler une variable sa_si gacti on , par exemple. 

Le gestionnaire de signaux devra dans ce cas avoir la forme suivante : 

void gestionnaire_signal (int numero, 

struct siginfo * info, 
void * inutile); 

La structure siginfo peut egalement etre implementee de maniere assez complexe, avec des 
champs en union. De maniere portable, on peut acceder aux membres suivants, definis par 
SUSv3 : 



Nom 


Signification 


si_signo 


Indique le numero de signal. 


si_sigval 


Est a son tour une union qui n'est utilisee qu'avec les signaux temps-reel, et que nous detaillerons 
done ulterieurement. 


si_code 


Indique la provenance du signal. II s'agit d'une combinaison binaire par OU entre diverses 
constantes, variant en fonction du signal regu. Si si_code est strictement positif, le signal provient 
du noyau. Sinon, il provient d'un utilisateur (meme root). Nous verrons des exemples avec les 
signaux temps-reel. 
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Nom Signification 

si_errno Ce champ contient la valeur de errno lors de I'invocation. Permet par exemple de la retablir en 

sortie de gestionnaire. 

si_pid et Ces membres ne sont valides que si le signal provient d'un utilisateur (si_code negatif ou nul), 

si_uid ou si le signal SIGCHLD a ete emis par le noyau, lis identifient I'emetteur du signal ou le processus 



tils qui s'est termine. 

Les informations fournies grace a la structure s i gi nf o peuvent etre tres importantes en termes 
de securite pour des programmes susceptibles d' avoir des privileges particuliers (Set-UID 
root). Cela permet de verifier que le signal est bien emis par le noyau et non par un utilisateur 
essayant d' exploiter une faille de securite. Nous reparlerons de ces donnees dans le prochain 
chapitre, car elles concernent egalement les signaux temps-reel. 

Lorsqu'on utilise l'attribut SAJNSTACK lors de I'invocation de sigaction( ), la pile est alors 
sauvegardee. II faut declarer une pile differente a l'aide de l'appel systeme sigaltstack( ). 
Les variables locales automatiques etant utilisees dans les routines, y compris les gestion- 
naires de signaux alloues dans la pile, il peut etre interessant dans certains cas de reserver 
avec malloc( ) une place memoire suffisamment importante pour accueillir des variables assez 
volumineuses. Les constantes MINSIGSTKSZ et SIGSTKSZ, definies dans <signal . h>, correspon- 
dent respectivement a la taille minimale et a la taille optimale pour la pile reservee a un 
gestionnaire de signaux. Une structure sigaltstack, definie dans <signal .h>, contient trois 
champs : 



Nom 


Type 




Signification 


ss_sp 


void * 


Pointeursurlapile 




ss_f 1 ags 


int 


Attributs 




ss_size 


s i ze_t 


Taille de la pile 





On alloue done la place voulue dans le champ ss_sp d'une variable stack_t, puis on invoque 
l'appel sigaltstack( ) en lui fournissant cette nouvelle pile. Elle sera alors utilisee pour tous 
les gestionnaires de signaux qui emploient l'attribut SAJNSTACK dans leur installation par 
si gaction( ). Le prototype de si gal tstack( ) est le suivant : 

int sigaltstack (stack_t * nouvelle. stack_t * ancienne); 

L'appel permet eventuellement de sauvegarder 1' ancienne pile en utilisant un second argu- 
ment non nul. Dans le cas ou le premier argument est NULL, aucune modification n'a lieu, on 
obtient simplement l'etat actuel de la pile. Cela permet de verifier si cette pile est en cours 
d'utilisation ou non. Les deux constantes symboliques SS_DISABLE et SSJNSTACK indiquent 
respectivement dans le champ ss_flags que la pile est desactivee ou qu'elle est en cours 
d'utilisation. 

Nous verrons un exemple d'utilisation de pile specifique pour les gestionnaires de signaux a 
la fin du paragraphe sur les exemples d'utilisation de sigaction( ). 
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Configuration des ensembles de signaux 

Avant de voir des exemples d'utilisation de sigaction( ), nous allons regarder les differentes 
primitives permettant de modifier les ensembles de signaux de type sigset_t. Ce type est 
opaque, et il faut absolument utiliser les routines decrites ci-dessous pour y acceder. 

A titre d'exemple, nous rappelons que le noyau Linux 2.0 definissait sigset_t comme un 
unsigned long, le noyau 2.2 comme un tableau de 2 unsigned long, et la bibliotheque GlibC 
comme un tableau de 32 unsi gned 1 ong (se reservant de la place pour des extensions jusqu'a 
1 024 signaux). La definition reelle du type sigset_t peut done varier suivant les machines, 
mais egalement selon les versions du noyau et meme le type de fichier d'en-tete utilise (noyau 
ou bibliotheque C). 

Les routines suivantes sont definies par SUSv3 : 

int sigemptyset (sigset_t * ensemble); 

int si gf i 1 1 set (sigset_t * ensemble); 

int sigaddset (sigset_t * ensemble, int numero_signal ) ; 

int sigdelset (sigset_t * ensemble, int numero_signal ) ; 

int sigismember (const sigset_t * ensemble, int numero_signal ) ; 

La premiere routine, sigemptyset( ), permet de vider un ensemble, e'est-a-dire de l'initialiser 
sans aucun signal. II ne faut pas utiliser une initialisation du genre ensembl e=0, car elle n'est 
pas suffisante dans le cas oil le type sigset_t est un tableau (dans la GlibC, par exemple). 
Parallelement, sigf il 1 set( ) permet de remplir un ensemble avec tous les signaux connus sur 
le systeme. Ces deux routines renvoient 0 si elles reussissent et-1 sinon, e'est-a-dire si 
ensembl e vaut NULL ou pointe sur une zone memoire invalide. 

Les routines sigaddsetO et sigdelsetO permettent respectivement d'ajouter un signal a un 
ensemble ou d'en supprimer. Elles renvoient 0 si elles reussissent ou -1 si elles echouent (si 
le numero de signal est invalide ou si ensemble est NULL). Le fait d'ajouter un signal a un 
ensemble qui le contient deja ou de supprimer un signal d'un ensemble auquel il n'appartient 
pas ne constitue pas une erreur. 

La derniere routine, si gi smember( ), permet de savoir si un signal appartient a un ensemble ou 
pas ; elle renvoie 1 si e'est le cas, ou 0 sinon. Elle peut egalement renvoyer -1 en cas d'erreur. 

La bibliotheque GlibC ajoute trois fonctionnalites qui sont des extensions Gnu (necessitant 
done la constante _GNU_SOURCE a la compilation). Elles permettent de manipuler les ensembles 
de signaux de maniere globale : 

int sigisemptyset (const sigset_t * ensemble) 
int sigandset (sigset_t * ensemble_resultat, 

const sigset_t * ensembl e_l, 

const sigset_t * ensemble_2) 
int sigorset (sigset_t * ensemble_resultat, 

const sigset_t * ensembl e_l, 

const sigset_t * ensemble_2) 

si gi semptyset( ) indique si l'ensemble considere est vide, si gandset( ) permet d'effectuer un 
ET binaire entre deux ensembles de signaux et d'obtenir dans l'ensemble resultat la liste 
des signaux qui leur sont communs. sigorsetO permet symetriquement d'effectuer un OU 
binaire pour obtenir en resultat l'ensemble des signaux presents dans l'un ou l'autre des deux 
ensembles. 
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Exemples d'utilisation de sigaction() 

Notre premier exemple consistera a installer deux gestionnaires : l'un pour SIGQUIT (que nous 
declenchons au clavier avec Contr61e-AltGr-\), qui ne fera pas redemarrer les appels systeme 
lents interrompus, le second, celui de S I G I NT (Controle-C), aura pour particularite de ne pas se 
reinstaller automatiquement. La seconde occurrence de SIGINT declenchera done le compor- 
tement par defaut et arretera le processus. 

exemple_sigaction 1.c : 

#include <signal .h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <errno.h> 

void 

gestionnaire (int numero) 
{ 

switch (numero) { 
case SIGQUIT : 

fprintftstdout, "\n SIGQUIT regu \n"); fflush(stdout) ; 

break; 
case SIGINT : 

fprintf (stdout, "\n SIGINT regu \n"); fflush(stdout); 
break; 

} 

} 

int 
main (void) 
{ 

struct sigaction action; 

action. sa_handler = gestionnaire; 
sigemptyset(& (action. sa_mask) ) ; 
action. sa_flags = 0; 

if (sigaction(SIGQUIT, & action, NULL) != 0) { 
fprintf (stderr, "Erreur %d \n", errno); 
exit(EXIT_FAILURE); 

} 

action. sa_handler = gestionnaire; 
sigemptyset(& (action. sa_mask) ) ; 
action.sa_flags = SA_RESTART | SA_RESETHAND; 
if (sigaction(SIGINT, & action, NULL) != 0) { 

fprintf (stderr, "Erreur ltd \n", errno); 

exit(EXIT_FAILURE); 

} 

/* Lecture continue, pour avoir un appel systeme lent bloque */ 
while (1) { 
int i ; 

fprintftstdout, "appel read()\n"); 
if (read(0, &i , sizeof (int)) < 0) 
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if (errno == EINTR) 

fprintf(stdout, "EINTR \n"); 

} 

return EXIT_SUCCESS; 

} 

L' execution de ce programme montre bien les differences de caracteristiques entre les signaux : 

$ ./exemple_sigaction_l 
appel readO 

Ctrl -AltGr-\ 

SIGQUIT regu 
EINTR 

appel readO 

Ctrl-C 

SIGINT regu 

Ctrl -AltGr-\ 

SIGQUIT regu 
EINTR 

appel readO 

Ctrl-C 

$ 

SIGQUIT interrompt bien 1' appel readO, mais pas SIGINT. De meme, le gestionnaire de 
SIGQUIT reste installe et peut etre appele une seconde fois, alors que SIGINT reprend son 
comportement par defaut et termine le processus la seconde fois. 

Nous n'avons pas sauvegarde l'ancien gestionnaire de signaux lors de 1' appel de si gaction( ) 
(troisieme argument). II est pourtant necessaire de le faire si nous installons temporairement 
une gestion de signaux propre a une seule partie du programme. De meme, lorsqu'un 
processus est lance en arriere-plan par un shell ne gerant pas le controle des jobs, celui-ci 
force certains signaux a etre ignores. Les signaux concernes sont SIGINT et SIGQUIT. Dans le 
cas d'un shell sans controle de jobs, ces signaux seraient transmis autant au processus en 
arriere-plan qu'a celui en avant-plan. 

Voici un exemple de programme permettant d'afficher les signaux dont le comportement n'est 
pas celui par defaut. 

exemple_sigaction 2.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <signal .h> 

#include <errno.h> 

int 
main (void) 

{ 

int i ; 

struct sigaction action; 

for (i = 1; i < NSIG; i ++) { 

if (sigaction(i , NULL, & action) != 0) 

fprintf (stderr, "Erreur sigaction %d \n", errno); 

if (action. sajiandler != S I G_D F L ) { 
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fprintf (stdout, "%d (%s) comportement ", 
i , sys_siglist [i]) ; 
if (action. sa_handler == SIG_IGN) 
fprintf (stdout, ": ignorer \n"); 

el se 

fprintf (stdout, "personnal i se \n"); 

} 

} 

return EXIT_SUCCESS; 

} 

Pourl'executer de maniere probante, il faut arreterle controle des jobs. Sous bash, cela s'effectue 
a Faide de la commande set +m. Au debut de notre exemple, bash a un controle des jobs active. 

$ ./exemple_sigaction_2 
$ . /exemple_sigaction_2 & 

[1] 983 

[1]+ Done ./exemple_sigaction_2 
$ set +m 

$ ./exemple_sigaction_2 
$ . /exemple_sigaction_2 & 

[1] 985 

2 (Interrupt) comportement : ignorer 
$ 3 (Quit) comportement : ignorer 
$ 

On voit qu'il n'y a effectivement de difference que pour les processus en arri ere -plan si le 
controle des jobs est desactive. II vaut done mieux verifier, au moment de l'installation d'un 
gestionnaire pour ces signaux, si le shell ne les a pas volontairement ignores. Dans ce cas, on 
les laisse inchanges : 

struct sigaction action, ancienne; 
action. sa_handler = gestionnaire; 
I* ... initialisation de action ... */ 
if (sigaction(SIGQUIT, & action, & ancienne) != 0) 

/* ... gestion d'erreur ... */ 
if (ancienne. sajiandler != S I G_D F L ) { 

/* reinstallation du comportement original */ 
sigaction(SIGQUIT, & ancienne, NULL); 

} 

Ceci n'est important que pour SIGQUIT et SIGINT. 

Profitons de cet exemple pour preciser le comportement des signaux face aux appels systeme 
fork( ) et exec( ) utilises notamment par le shell. Lors d'un fork( ), le processus his recoit le 
meme masque de blocage des signaux que son pere. Les actions des signaux sont egalement 
les memes, y compris les gestionnaires installes par le programme. Par contre, les signaux en 
attente n'appartiennent qu'au processus pere. 

Lors d'un exec( ), le masque des signaux bloques est conserve. Les signaux ignores le restent. 
C'est comme cela que le shell nous transmet le comportement decrit ci-dessus pour SIGINT et 
SIGQUIT. Mais les signaux qui etaient captures par un gestionnaire reprennent leur comporte- 
ment par defaut. C'est logique car l'ancienne adresse du gestionnaire de signaux n'a plus 
aucune signification dans le nouvel espace de code du programme execute. 
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On peut s'interroger sur la pertinence de melanger dans un meme programme les appels a 
signal ( ) et a sigaction( ). Cela ne pose aucun probleme majeur sous Linux avec GlibC. Le 
seul inconvenient vient du fait que si gnal ( ) ne peut pas sauvegarder et retablir ulterieurement 
autant d' informations sur le gestionnaire de signaux que s i g a ct i on ( ) . Ce dernier en effet peut 
sauver et reinstaller les attributs comme NOCLDSTOP ou NODEFER, au contraire de signal ( ). 

Lorsqu'il faut sauvegarder un comportement pour le restituer plus tard, il faut done imperati- 
vement utiliser sigaction( ), sauf si tout le programme n'utilise que signal ( ). 

Lorsqu'on installe un gestionnaire avec signal ( ) sous Linux et qu'on examine le comporte- 
ment du signal avec si gacti on ( ), on retrouve dans le champ sajiandl er la meme adresse que 
celle de la routine installee avec signal ( ). Ceci n'est toutefois pas du tout generalisable a 
d'autres systemes, et il ne faut pas s'appuyer sur ce comportement. Voici un exemple de test. 

exemple_sigaction_3.c : 

#include <signal .h> 
#include <stdio.h> 
finclude <stdlib.h> 

void 

gestionnaire (int inutilise) 
{ } 

int 
main (void) 

{ 

struct sigaction action; 

signal (SIGUSR1, gestionnaire); 

sigactiontSIGUSRl, NULL, & action); 
if (action. sa_handler == gestionnaire) 
fprintf (stdout, "Meme adresse \n"); 

el se 

fprintf (stdout, "Adresse differente \n"); 
return EXIT_SUCCESS; 

} 

Sous Linux, pas de surprise : 

$ uname -sr 

Linux 2.0.31 

$ ./exemple_si gacti on_3 

Meme adresse 
$ 

$ uname -sr 

Linux 2.6.9 

$ . /exemple_si gacti on_3 

Meme adresse 
$ 
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Nous terminerons cette section avec un exemple d' installation d'une pile specifique pour 
les gestionnaires de signaux. Nous allons mettre en place un gestionnaire commun pour les 
signaux SIGQUIT et SIGTERM, qui verifiera si la pile est en cours d'utilisation ou non en exami- 
nant le champ ss_fl ags. Nous n'installerons la pile speciale que pour le signal SIGQUIT, ce qui 
nous permettra de verifier la difference entre les deux signaux. 

exemple_sigaltstack.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <signal .h> 
#include <errno.h> 

void 

gestionnaire (int numero_signal ) 
f 

stack_t pile; 

fprintf (stdout, "\n Signal %d recu \n", numero_signal ) ; 
if (sigaltstack(NULL, & pile) != 0) { 

fprintf (stderr, "Erreur sigaltstack %d \n", errno); 

return ; 

} 

if (pile.ss_flags & SS_DISABLE) 

fprintf (stdout, "La pile speciale est inactive \n"); 

el se 

fprintf (stdout, "La pile speciale est active \n"); 
if (pile.ss_flags & SS_0NSTACK) 

fprintf (stdout, "Pile speciale en cours d'utilisation \n"); 

el se 

fprintf (stdout, "Pile speciale pas utilisee actuellement \n"); 

} 

int 
main (void) 
{ 

stack_t pile; 

struct sigaction action; 

if ((pile.ss_sp = malloc(SIGSTKSZ)) == NULL) { 
fprintf (stderr, "Pas assez de memoire \n"); 
exit(EXIT_FAILURE); 

} 

pile.ss_size = SIGSTKSZ; 
pi 1 e. ss_f 1 ags = 0; 

if (sigaltstack(& pile, NULL) != 0) { 

fprintf (stderr, "Erreur sigaltstackO %d \n", errno); 
exit(EXIT_FAILURE); 

} 

action. sa_handler = gestionnaire; 
sigemptyset(& (action .sa_mask) ) ; 
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action.sa_flags = SA_RESTART | SA_ONSTACK; 

if (sigactiontSIGQUIT, & action, NULL) != 0) { 

fprintf (stderr, "Erreur sigactionO %d \n", errno); 

exi t( EXIT_FAI LURE) ; 

} 

action. sa_handler = gestionnaire; 
sigemptyset(& (action . sajnask)); 
action.sa_flags = SA_RESTART; 
if (sigaction(SIGTERM, & action, NULL) != 0) { 

fprintf (stderr, "Erreur sigactionO %d \n", errno); 

exi t(EXIT_FAI LURE) ; 

} 

fprintf (stdout, " PID = %ld \n", (long) getpidO); 
ffl ush(stdout) ; 
while (1) 

pauset ) ; 
return EXIT_SUCCESS; 

} 

Voici un exemple d'utilisation : 

$ . /exemple_sigaltstack 

PID = 815 

$ kill -QUIT 815 

Signal 3 regu 

La pile speciale est active 
Pile speciale en cours d'utilisation 
$ kill -TERM 815 

Signal 15 regu 
La pile speciale est active 
Pile speciale pas utilisee actuel 1 ement 
$ kill -INT 815 

$ 

Comme prevu, la pile speciale des signaux reste active en permanence, mais elle n'est utilisee 
que lorsque le gestionnaire est invoque par SIGQUIT. 



Blocage des signaux 

Nous avons mentionne a plusieurs reprises qu'un processus pouvait bloquer a volonte un 
ensemble de signaux, sauf SIGKILL et SIGSTOP. Cette operation se fait principalement grace a 
l'appel systeme sigprocmask( ). Cette routine est tres complete puisqu'elle permet aussi bien 
de: 

• bloquer ou debloquer des signaux ; 

• fixer un nouveau masque complet ; 

• consulter l'ancien masque de blocage. 

Le prototype de sigprocmaskt ) est le suivant : 

int sigprocmask (int methode, 

const sigset_t * ensemble, 
sigset_t * ancien) ; 
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Quelle que soit la methode choisie, si le troisieme argument ancien est un pointeur non NULL, 
il sera rempli avec le masque actuel de blocage des signaux. Le premier argument permet 
d'indiquer Taction attendue, par l'intermediaire de l'une des constantes symboliques 
suivantes : 





Nom 


Signification 


SIG 


.BLOCK 


On ajoute la lists des signaux contenus dans I'ensemble transmis en second argument au masque 
de blocage des signaux. II s'agit d'une addition au masque en cours. 


SIG 


.UNBLOCK 


On retire les signaux contenus dans I'ensemble en second argument au masque de blocage des 
signaux. S'il existe un ou plusieurs signaux debloques en attente, au moins un de ces signaux est 
immediatement delivre au processus, avant le retour de I'appel systeme sigprocmask( ). 


SIG 


.SETMASK 


Le second argument est utilise directement comme masque de blocage pour les signaux. Comme 
pour SIGJJNBLOCK, la modification du masque peut entrainer le deblocage d'un ou de plusieurs 
signaux en attente. Lun au moins de ces signaux est alors delivre immediatement avant le retour 
de sigprocmaskt ). 





La fonction sigprocmask( ) renvoie 0 si elle reussit, et-1 en cas d'erreur, c'est-a-dire avec 
errno valant EINVAL en cas de methode inexistante ou E FAULT si l'un des pointeurs est mal 
initialise. Les signaux SIGKILL et SIGSTOP sont silencieusement elimines du masque transmis 
en second argument, sans declencher d'erreur. II est done possible de transmettre un ensemble 
de signaux remplis avec si gf i 1 1 set( ) pour tout bloquer ou tout debloquer, sans se soucier de 
SIGKILL et SIGSTOP. 

L'appel systeme si gprocmaskC ) doit remplacer totalement les anciens appels sigblockO, 
siggetmask( ), sigsetmask( ), sigmask( ) qui sont desormais obsoletes. 

L'utilite principale d'un blocage des signaux est la protection des portions critiques de code. 
Imaginons qu'un gestionnaire modifie une variable globale comme une structure. Lorsque le 
programme principal est en train de lire ou de modifier cette variable, il risque d'etre inter- 
rompu par ce signal au milieu de la lecture et d' avoir des incoherences entre les premiers et 
les derniers champs lus. L'effet peut etre encore pire avec une chame de caracteres. Pour 
eviter cette situation, on bloque temporairement l'arrivee du signal concerne pendant la 
lecture ou la modification de la variable globale. 

Imaginons qu'on ait une variable globale du type : 

typedef struct { 

double X; 

double Y ; 
} point_t; 

point_t centre, pointeur; 
Que le gestionnaire de SIGUSR1 modifie la variable centre : 

void gestionnaire_sigusrl (int i nuti 1 i se) 
{ 

centre. X = pointeur. X; 
centre. Y = pointeur. Y; 

} 
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On protegera dans le corps du programme Faeces a cette variable : 
sigset_t ensemble, ancien; 

sigemptyset(& ensemble); 
sigaddset(& ensemble, SIGUSR1); 

sigprocmask(SIG_BLOCK, & ensemble, & ancien); 
XI = centre. X * zoom; /* Voici la portion critique */ 

Yl = centre. Y * zoom; /* protegee de SIGUSR1 */ 

sigprocmask(SIG_SETMASK, & ancien, NULL) ; 

cercle(centre.X, centre. Y, rayon); 

Ceci peut paraitre un peu lourd, mais l'ensemble en question n'a besoin d'etre initialise qu'une 
seule fois, et on peut aisement definir des macros pour encadrer les portions de code critiques. 

II est important qu'un processus puisse consulter la liste des signaux bloques en attente, sans 
pour autant en demander la delivrance immediate. Cela s'effectue a l'aide de l'appel systeme 
sigpending( ) , dont le prototype est : 

int sigpending (sigset_t * ensemble); 

Comme on pouvait s'y attendre, cette routine remplit l'ensemble transmis en argument avec 
les signaux en attente. Voici un programme qui permet d'en voir le fonctionnement. Tout 
d'abord, nous installons un gestionnaire qui indique le numero du signal recu, et ce pour tous 
les signaux. Ce gestionnaire ne relance pas les appels systeme lents interrompus. Ensuite, 
nous bloquons tous les signaux, sauf SIGI NT (Controle-C), et nous lancons une lecture bloquee, 
pendant laquelle nous pouvons appuyer sur des touches speciales du clavier (Controle-Z, 
Controle-AltGrA) ou envoyer des signaux depuis une autre console. Lorsque nous appuyons 
sur Controle-C, SIGI NT non bloque fait echouer la lecture, et le programme continue, nous 
indiquant la liste des signaux bloques en attente. Nous debloquons alors tous les signaux et 
nous les regardons arriver. 

exemple_sigpending.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <signal .h> 

#include <errno.h> 

#include <unistd.h> 

#ifdef _POSIX_REALTIME_SIGNALS 

#define NB_SIG_C LASSIQUES SIGRTMIN 



#endif 
void 

gestionnaire (int numero_signal ) 

{ 

fprintf (stdout, "%d (%s) regu \n", numero_signal , 



#else 



#define NB_S I G_C LASS I QU ES 



NSIG 



sys_sigl ist[numero_signal ]) ; 
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int 
main (void) 
{ 

int i ; 

struct sigaction action; 
sigset_t ensemble; 

action. sa_handler = gestionnaire; 
sigemptyset(& (action. sa_mask) ) ; 
action.sa_flags = 0; /* Pas de SA_RESTART */ 
for (i = 1; i < NSIG; i ++) 

if (sigaction(i , & action, NULL) != 0) 



/* On bloque tout sauf SIGINT */ 
sigfillset(& ensemble); 
sigdelset(& ensemble, SIGINT); 
sigprocmask(SIG_BLOCK, & ensemble, NULL); 

/* un appel systeme lent bloque */ 
read(0, & i, sizeof(int)) ; 

/* Voyons maintenant qui est en attente */ 
sigpending(& ensemble); 
for (1 = 1; 1 < NB_SIG_CLASSIQUES; i ++) 
if (sigismember(& ensemble, i)) 

fprintf (stdout, "en attente %d Us)\n", 



/* On debloque tous les signaux pour les voir arriver */ 
sigemptyset(& ensemble); 
sigprocmask(SIG_SETMASK, & ensemble, NULL); 
return EXIT_SUCCESS; 



Voici un exemple d' execution avec, en seconde colonne, les commandes saisies sur une autre 
console. 

$ ./exemple_sigpending 
4419 : 9 pas capture 
4419 : 19 pas capture 

(Controle-Z) 

(Contr61e-AltGr-\) 



(Controle-C) 

2 (Interrupt) recu 

en attente 3 (Quit) 

en attente 10 (User defined signal 1) 

en attente 13 (Broken pipe) 

en attente 15 (Terminated) 

en attente 20 (Stopped) 



fprintf (stderr, "%ld : %d pas capture \n", 
(long) getpidO, i); 



i, sys_sigl i st[i ] ) ; 



$ kill 

$ kill 

$ kill 

$ kill 



TERM 4419 
USR1 4419 
PIPE 4419 
PIPE 4419 
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3 (Quit) regu 

10 (User defined signal 1) regu 

13 (Broken pipe) regu 

15 (Terminated) regu 

20 (Stopped) regu 

$ 

On remarque deux choses : d'abord le signal PIPE a ete emis deux fois mais n'est recu qu'en 
un seul exemplaire. C'est normal, Linux n'empile pas les signaux classiques. Ensuite, les 
signaux sont delivres dans l'ordre numerique et non pas dans leur ordre chronologique 
d'arrivee. C'est en fait une consequence de la premiere remarque. Notez bien que la deli- 
vrance par ordre numerique croissant est simplement un detail d' implementation sous Linux, 
et n'est absolument pas normalisee par SUSv3. 

II n'y a pas non plus de notion de priorite entre les signaux classiques. Si on desire introduire 
un ordre precis, on peut debloquer signal par signal en utilisant plusieurs fois de suite 
si gprocmask( ). 



II y a de nombreuses occasions dans un programme oil on desire attendre passivement 
l'arrivee d'un signal qui se produira de maniere totalement asynchrone (par exemple pour se 
synchroniser avec un processus fils). 

Pour cela, l'appel-systeme le plus evident est pause( ). Celui-ci endort le processus jusqu'a ce 
qu'il soit interrompu par n'importe quel signal. II est declare dans <uni std . h> , ainsi : 

int pause (void) ; 

Cet appel systeme renvoie toujours -1 en remplissant errno avec la valeur EINTR. 

Le probleme qui se pose souvent est d'arriver a encadrer correctement pause( ) , de facon a 
eviter de perdre des signaux. Imaginons que SIGUSR1 dispose d'un gestionnaire faisant passer 
aO une variable globale nommee attente. On desire bloquer l'execution du programme 
jusqu'a ce que cette variable ait change. La premiere version naive de ce programme serait : 

attente = 1; 

while (attente != 0) 



Nous utilisons une boucle whi let) car il se peut que l'appel systeme pause( ) soit interrompu 
par un autre signal qui ne modifie pas la variable. 

Le gros probleme de ce type de comportement est que le signal peut arriver entre le test 
(attente!=0) et l'appel pauseO. Si le signal modifie la variable a ce moment-la, et si le 
programme ne recoit plus d'autres signaux, le processus restera bloque indefiniment dans 



Un autre probleme se pose, car on peut avoir d'autres taches a accomplir dans la boucle (en 
rapport, par exemple, avec les autres signaux recus), et le signal peut eventuellement arriver 
dans ces periodes genantes. 

Pour eviter cette situation, on pourrait vouloir bloquer le signal temporairement ainsi : 

sigset_t ensemble; 
sigset_t ancien; 



Attente d'un signal 



pauset ) ; 



pause( ). 
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sigemptyset(& ensemble); 

sigaddset(& ensemble, SIGUSR1); 

sigprocmask(SIG_BLOCK, & ensemble, & ancien); 

attente = 1; 

while (attente != 0) { 

sigprocmask(SIG_UNBLOCK, & ensemble, NULL); 

pause( ) ; 

sigprocmask(SIG_BLOCK, & ensemble, NULL); 
/* traitement pour les autres signaux */ 

} 

sigprocmask(SIG_SETMASK, & ancien, NULL); 

Malheureusement, nous avons indique qu'un signal bloque en attente etait delivre avant le 
retour de sigprocmask( ) , qui le debloque. Nous avons ainsi encore augmente le risque d'un 
blocage infini dans pauseO. On pourrait verifier de nouveau (attente!=0) entre sigproc- 
mask( ) et pause( ), mais le signal pourrait encore s'infiltrer entre ces deux etapes et bloquer 
indefiniment. 

II existe un appel systeme, sigsuspendO, qui permet de maniere atomique de modifier le 
masque des signaux et de bloquer en attente. Une fois qu'un signal non bloque arrive, sigsus- 
pend( ) restitue le masque original avant de se terminer. Son prototype est : 

int sigsuspend (const sigset_t * ensemble); 



Attention 

L'ensemble transmis est celui des signaux qu'on bloque, pas celui des signaux qu'on attend. 



Voici comment Futiliser, pour attendre l'arrivee de SIGUSR1. 

sigset_t ensemble; 

sigset_t ancien; 

int sigusrl_dans_masque = 0; 

sigemptyset(& ensemble); 
sigaddset(& ensemble, SIGUSR1); 
sigprocmask(SIG_BLOCK, & ensemble, & ancien); 
if (sigismember(& ancien, SIGUSRD) { 

sigdelset(& ancien, SIGUSRD; 

sigusrl_dans_masque = 1; 

} 

/* initialisation, etc. */ 
attente = 1; 
while (attente != 0) { 
sigsuspend(& ancien); 

/* traitement pour les eventuels autres signaux */ 

} 

if (sigusrl_dans_masque) 

sigaddset(& ancien, SIGUSRD; 
sigprocmask(SIG_SETMASK, & ancien, NULL); 
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On remarquera que nous prenons soin de restituer l'ancien masque de blocage des signaux en 
sortie de routine, et qu'en transmettant cet ancien masque a sigsuspend( ) , nous permettons 
l'arrivee d'autres signaux que SIGUSR1. 

Signalons qu'il existe un appel systeme sigpause( ) obsolete, qui fonctionnait approximative - 
ment comme si gsuspend( ), mais en utilisant un masque de signaux contenu obligatoirement 
dans un entier de type int. 

Ecriture correcte d'un gestionnaire de signaux 

En theorie, suivant le C Ansi, la seule chose qu'on puisse faire dans un gestionnaire de 
signaux est de modifier une ou plusieurs variables globales de type s i g_atomi c_t (defini dans 
<si gnal . h>). II s'agit d'un type entier, souvent un int d'ailleurs, que le processeur peut traiter 
de maniere atomique, c'est-a-dire sans risque d'etre interrompu par un signal. II faut declarer 
la variable globale avec l'indicateur vol ati 1 e pour signaler au compilateur qu'elle peut etre 
modifiee a tout moment, et pour qu'il ne se livre pas a des optimisations (par exemple en 
gardant la valeur dans un registre du processeur). Dans ce cas extreme, le gestionnaire ne fait 
que positionner l'etat d'une variable globale, qui est ensuite consultee dans le corps du 
programme. 

Nous avons vu qu'avec une gestion correcte des blocages des signaux, il est en fait possible 
d'acceder a n'importe quel type de donnees globales. Le meme probleme peut toutefois se 
presenter si un signal non bloque arrive alors qu'on est deja dans 1' execution du gestionnaire 
d'un autre signal. C'est a ce moment que le champ sa_mask de la structure sigaction prend 
tout son sens. 

Une autre difficulte est de savoir si on peut invoquer, depuis un gestionnaire de signaux, un 
appel systeme ou une fonction de bibliotheque. Une grande partie des fonctions de biblio- 
theque ne sont pas reentrantes. Cela signifie qu'elles utilisent en interne des variables stati- 
ques ou des structures de donnees complexes, comme mallocO, et qu'une fonction inter- 
rompue en cours de travail dans le corps principal du programme ne doit pas etre rappelee 
depuis un gestionnaire de signaux. Prenons l'exemple de la fonction ctime( ). Celle-ci prend 
en argument un pointeur sur une date du type ti me_t , et renvoie un pointeur sur une chaine de 
caracteres decrivant la date et l'heure. Cette chaine est allouee de maniere statique et est 
ecrasee a chaque appel. Si elle est invoquee dans le corps du programme, interrompue et 
rappelee dans le gestionnaire de signaux, au retour de ce dernier, la valeur renvoyee dans le 
corps du programme principal ne sera pas celle qui est attendue. Les fonctions de biblio- 
theque qui utilisent des variables statiques le mentionnent dans leurs pages de manuel. II est 
done necessaire de les consulter avant d'introduire la fonction dans un gestionnaire. 

II est important egalement d'eviter resolument les fonctions qui font appel indirectement a 
mal 1 oc( ) ou a f ree( ) , comme tempnam( ). 

II existe une liste minimale, definie par SUSv3, des appels systeme pouvant etre invoques 
depuis un gestionnaire de signaux {async-signal-safe). Ces appels sont soit reentrants, soit 
non-interruptibles par les signaux. Remarquons qu'un appel async-signal-safe est egalement 
utilisable sans restriction en programmation multithread, mais que la reciproque n'est pas 
toujours vraie (par exemple mal 1 oc( ) est correct pour les programmes multithreads mais ne 
doit pas etre invoque dans un gestionnaire de signaux). 
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Les appels « async-signal-safe » de SUSv3 sont : 
_Exit, _exit. 

abort, accept, access, aio_error, aio_return, aio_suspend, alarm, 
bind, 

cfgeti speed, cfgetospeed, cfseti speed, cfsetospeed, chdir, chmod, chown, 

clock_gettime, close, connect, creat, 
dup, dup2, 
execle, execve, 

fchmod, fchown, fcntl , fdatasync, fork, fpathconf, fstat, fsync, ftruncate, 
getegid, geteuid, getgid, getgroups, getpeername, getpgrp, getpid, getppid, 

getsockname, getsockopt, getuid, 
kill, 

link, listen, lseek.lstat, 
mkdir, mkfifo, 
open , 

pathconf, pause, pipe, poll, posix_trace_event, pselect, 
raise, read, readlink, recv, recvfrom, recvmsg, rename, rmdir, 

select, sem_post, send, sendmsg, sendto, setgid, setpgid, setsid, setsockopt setuid, 
shutdown, sigaction, sigaddset, sigdelset, sigemptyset, sigfillset, sigismember, 
sleep, signal, sigpause, sigpending, sigprocmask, sigqueue, sigset, sigsuspend, 
socket, socketpair, stat, symlink, sysconf, 

tcdrain, tcflow, tcflush, tcgetattr. tcgetpgrp, tcsendbreak, tcsetattr, tcsetpgrp, 
time, timer_getoverrun, timer_gettime, timer_settime, times, 

umask, uname, unlink, utime, 

wait, waitpid, write 

Les fonctions d' entree-sortie sur des flux, f pri ntf ( ) par exemple, ne doivent pas etre utilisees 
sur le meme flux entre le programme principal et un gestionnaire, a cause du risque important 
de melange anarchique des donnees. Par contre, il est tout a fait possible de reserver un flux 
de donnees pour le gestionnaire (stderr par exemple), ou de l'employer si nous sommes surs 
que le programme principal ne l'utilise pas au meme moment. 

II est tres important qu'un gestionnaire de signaux employant le moindre appel systeme 
sauvegarde le contenu de la variable globale errno en entree du gestionnaire et qu'il la restitue 
en sortie. Cette variable est en effet modifiee par la plupart des fonctions systeme, et le signal 
peut tres bien s'etre declenche au moment ou le programme principal terminait un appel 
systeme et se preparait a consulter errno. 

Notons, pour terminer, que dans les programmes s'appuyant sur l'environnement graphique 
XI 1, il ne faut en aucun cas utiliser les routines graphiques (Xlib, Xt, Motif...), qui ne sont 
pas reentrantes. II faut alors utiliser des variables globales comme indicateurs des actions a 
executer dans le corps meme du programme. 

II peut arriver que le travail du gestionnaire soit d'effectuer simplement un peu de nettoyage 
avant de terminer le processus. L' arret peut se faire avec l'appel systeme _exit( ) ou exit( ). 
Neanmoins, il est souvent preferable que le processus pere sache que son fils a ete tue par un 
signal et qu'il ne s'est pas termine normalement. Pour cela, il faut reprogrammer le compor- 
tement original du signal et se Fenvoyer a nouveau. Bien sur, cela ne fonctionne qu'avec des 
signaux qui terminent par defaut le processus (comme SIGTERM). De plus, dans certains cas 
(comme SIGSEGV), un fichier d'image memoire core sera cree. 



Gestion portable des signaux 

Chapitre 7 



exemplejatal.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <signal .h> 



void 

gestionnai re_signal_fatal (int numero) 
{ 

/* Effectuer le nettoyage : */ 
/* Couper proprement les connexions reseau */ 
/* Supprimer les fichiers de verrouil 1 age */ 
/* Tuer eventuel 1 ement les processus fils */ 
fprintf (stdout, "\n Je fais le menage !\n"); 
ff 1 ush(stdout) ; 
signal (numero, S I G_D F L) ; 
raise(numero) ; 



int 
main () 

{ 

struct sigaction action; 

action. sa_handler = gestionnaire_signal_fatal ; 
action. sa_flags = 0; 
sigfillset(& action. sa_mask) ; 

fprintf (stdout, "mon pi d est %ld\n", (long) getpid ()); 
if ((sigaction(SIGTERM, & action, NULL) != 0) 
|| (sigaction(SIGSEGV, & action, NULL) != 0)) { 

perrorC'sigaction") ; 

exi t( EXIT_FAI LURE) ; 

} 

while (1) 

pauset ) ; 
return EXIT_SUCCESS; 

} 

Voici un exemple d' execution. On envoie les signaux depuis une autre console. Le shell (bash 
en l'occurrence) nous indique que les processus ont ete tues par des signaux. 

$ . /exemple_fatal 

mon pid est 6032 

$ kill -TERM 6032 

Je fais le menage ! 

Terminated 

$ . /exemple_fatal 

mon pid est 6033 

$ kill -SEGV 6033 

Je fais le menage ! 
Segmentation fault (core dumped) 
$ 
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Les messages Terminated ou Segmentation fault sont affiches par le shell lorsqu'il se rend 
compte que son processus se termine anormalement. 

II y a ici un point de securite a noter : certains programmes, souvent Set-UID root, disposent 
temporairement en memoire de donnees que meme Futilisateur qui les a lances ne doit pas 
connaitre. Cela peut concerner par exemple le fichier shadow des mots de passe ou les infor- 
mations d'authentification servant a etablir la liaison avec un fournisseur d'acces Internet. 
Dans ce genre d' application, il est important que le programme ecrase ces donnees sensibles 
avant de laisser le gestionnaire par defaut creer une eventuelle image memoire core qu'on 
pourrait examiner par la suite. 

Utilisation d un saut non local 

Une troisieme maniere de terminer un gestionnaire de signaux est d'utiliser un saut non local 
si gl ongjmp( ). Dans ce cas, l'execution reprend dans un contexte different, qui a ete sauve- 
garde auparavant. On evite ainsi certains risques de bogues dus a Farrivee intempestive de 
signaux, tels que nous en utiliserons pour SIGALRM a la fin de ce chapitre. De meme, cette 
methode permet de reprendre le controle d'un programme qui a, par exemple, recu un signal 
indiquant une instruction illegale. SUSv3 precise que le comportement d'un programme qui 
ignore les signaux d'erreur du type SIGFPE, SIGILL, SIGSEGV est indefini. Nous avons vu que 
certaines de ces erreurs peuvent se produire a la suite de debordements de pile ou de mauvaises 
saisies de Futilisateur dans le cas des routines mathematiques. Certaines applications desirent 
rester insensibles a ces erreurs et reprendre leur execution comme si de rien n'etait. C'est 
possible grace a Femploi de sigsetjmp( ) et sigl ongjmp( ). Ces deux appels systeme sont des 
extensions des anciens setjmpO et longjmpO, qui posaient des problemes avec les gestion- 
naires de signaux. 

L'appel systeme sigsetjmp( ) a le prototype suivant, declare dans <setjmp.h> : 

int sigsetjmp (sigjmp_buf contexte, int sauver_signaux) ; 

Lorsque sigsetjmp( ) est invoque dans le programme, il memorise dans le buffer transmis en 
premier argument le contexte d' execution et renvoie 0. Si son second argument est non nul, il 
memorise egalement le masque de blocage des signaux dans le premier argument. 

Lorsque le programme rencontre l'appel systeme sigl ongjmp( ), dont le prototype est : 

void siglongjmp (sigjmp_buf contexte, int valeur); 

l'execution reprend exactement a l'emplacement du sigsetjmpO correspondant au meme 
buffer, et celui-ci renvoie alors la valeur indiquee en second argument de si gl ongjmp( ). Cette 
valeur permet de differencier la provenance du saut, par exemple depuis plusieurs gestion- 
naires de signaux d'erreur. 

L' inconvenient des sauts non locaux est qu'un usage trop frequent diminue sensiblement 
la lisibilite des programmes. II est conseille de les reserver toujours au meme type de cir- 
constances dans une application donnee, pour gerer par exemple des temporisations, comme 
nous le verrons ulterieurement avec le signal SIGALRM. 

Nous allons pour l'instant creer un programme qui permet a Futilisateur de saisir deux 
valeurs numeriques entieres, et qui les divise Fune par Fautre. Si un signal SIGFPE se produit 
(on a demande une division par zero), l'execution reprendra quand meme dans un contexte 
propre. 



Gestion portable des signaux 




Chapitre 7 



exemple_siglongjmp.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <signal .h> 

#include <setjmp.h> 

sigjmp_buf contexte; 

void 

gestionnai re_sigfpe (int numero) 
{ 

siglongjmp(contexte, 1); 

/* Si on est ici le saut a rate, il faut quitter */ 
signal (numero, S I G_D F L) ; 
raise(numero) ; 

} 

int 
main (void) 

{ 

int p, q, r; 

struct sigaction action; 
action.sa_handler = gestionnai re_sigfpe; 
action.sa_flags = 0; 
si gf i 1 1 set ( & action. sajnask) ; 
sigactiontSIGFPE, & action, NULL); 

while (1) { 

if (sigsetjmp(contexte, 1) != 0) { 

/* On est arrive ici par siglongjmpO */ 

fprintf (stdout, "Aie ! erreur mathematique ! \n"); 

fflush(stdout) ; 



while (1) { 

fprintf (stdout, "Entrez le dividende p : "); 
if (fscanf (stdin, "%d" , & p) == 1) 
break; 



while (1) { 

fprintf (stdout, "Entrez le diviseur q : "); 
if (fscanf (stdin, "%d" , & q) == 1) 
break; 



r - p / q; 

fprintf (stdout, "rapport p / q = M\n", r); 



return EXIT_SUCCESS; 

} 
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Un petit exemple d' execution : 

$ ./exemple_siglongjmp 

Entrez le dividende p : 8 
Entrez le diviseur q : 2 
rapport p / q = 4 
Entrez le dividende p : 6 
Entrez le diviseur q : 0 
Aie ! erreur mathematique ! 
Entrez le dividende p : 6 
Entrez le diviseur q : 3 
rapport p / q = 2 

Entrez le dividende p : (Controle-C) 
$ 

Ce genre de technique est surtout utilisee dans les interpreters de langages comme Lisp pour 
permettre de revenir a une boucle principale en cas d' erreur. 

Les anciens appels systeme set jmp( ) et 1 ongjmp( ) fonctionnaient de la meme maniere, mais 
ne sauvegardaient pas le masque des signaux bloques (comme si le second argument de 
si gl ongjmp( ) valait 0). Le masque retrouve dans le corps du programme n'est done pas 
necessairement celui qui est attendu. En effet, au sein d'un gestionnaire, le noyau bloque 
le signal concerne, ce qui n'est surement pas ce qu'on desire dans la boucle principale du 
programme. 

Un signal particulier : I'alarme 

Le signal SIGALRM est souvent utilise comme temporisation pour indiquer un delai maximal 
d'attente pour des appels systeme susceptibles de bloquer. On utilise l'appel systeme al arm( ) 
pour programmer une temporisation avant la routine concernee, et SIGALRM sera declenche 
lorsque le delai sera ecoule, faisant echouer l'appel bloquant avec le code EINTR dans errno. 
Si la routine se termine normalement avant le delai maximal, on annule la temporisation avec 
al arm(O). 

II y a de nombreuses manieres de programmer des temporisations, mais peu sont tout a fait 
fiables. On considerera que l'appel systeme a surveiller est une lecture depuis une socket reseau. 

II est evident que SIGALRM doit etre intercepte par un gestionnaire installe avec sigactionO 
sans l'option RESTART dans sa_flags (sinon l'appel bloque redemarrerait automatiquement). 
Ce gestionnaire peut etre vide, son seul role est d'interrompre l'appel systeme lent. 

void 

gestionnaire_sigalrm (int inutilise) { 
/* ne fait rien */ 

} 

L installation en est faite ainsi : 
struct sigaction action; 

sigemptyset(& (action . sajnask)); 
action. sa_flags = 0; 

action. sa_handler = gestionnaire_sigalrm; 
sigaction(SIGALRM, action, NULL); 
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Nous allons commencer par cet exemple naif : 
al armtdel aijnaximal ) ; 

taille_lue = read(fd_socket, buffer, tai 1 1 e_buffer) ; 
al arm(O) ; 

if ((taillejue != taille_buffer) && (errno == EINTR) ) 
fprintf (stderr, "delai maximal ecoule \n"); 
return(-l); 

} 

/* ... suite ... */ 

SUSv3 autorisant l'appel systeme read( ) a renvoyer soit -1, soit le nombre d'octets lus lors 
d'une interruption par un signal, nous comparerons sa valeur de retour avec la taille attendue 
et non avec -1. Cela ameliore la portability de notre programme. 

Le premier probleme qui se pose est qu'un signal autre que Falarme peut avoir interrompu 
l'appel systeme read( ). Cela peut se resoudre en imposant que tous les autres signaux geres 
par le programme aient l'attribut SA_RESTART valide pour faire redemarrer l'appel bloquant. 
Toutefois, un probleme subsiste, car le redemarrage n'a generalement lieu que si read( ) n'a 
pu lire aucun octet avant l'arrivee du signal. Sinon, l'appel se termine quand meme en 
renvoyant le nombre d'octets lus. 

Le second probleme est que, sur un systeme tres charge, le delai peut s'ecouler entierement 
entre la programmation de la temporisation et l'appel systeme lui-meme. II pourrait alors 
rester bloque indefiniment. 

Ce qu'on aimerait, c'est disposer d'un equivalent a sigsuspend( ), qui permette d'effectuer de 
maniere atomique le deblocage d'un signal et d'un appel systeme. Malheureusement, cela 
n'existe pas. 

Nous allons done utiliser une autre methode, plus complexe, utilisant les sauts non locaux 
depuis le gestionnaire. Quel que soit le moment oil le signal se declenche, nous reviendrons 
au meme emplacement du programme et nous annulerons alors la lecture. Bien entendu, le 
gestionnaire de signaux doit etre modifie. II n'a plus a etre installe sans l'option SA_RESTART 
puisqu'il ne se terminera pas normalement. 

Cet exemple va servir a temporiser la saisie d'une valeur numerique depuis le clavier. Nous 
lirons une ligne complete, puis nous essayerons d'y trouver un nombre entier. En cas d'echec, 
nous recommencerons. Malgre tout, un delai maximal de 5 secondes est programme, apres 
lequel le programme abandonne. 

exemple_alarm.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <signal .h> 

#include <setjmp.h> 

#include <unistd.h> 

sigjmp_buf contexte_sigal rm; 

void 

gestionnaire_sigal rm (int inutilise) 
{ 

siglongjmp(contexte_sigal rm, 1) ; 
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int 
main (void) 



char 
int 




struct sigaction action; 

action. sa_handler = gestionnaire_sigalrm; 

action. sa_flags = 0; 

sigfillset(& action.sa_mask); 

sigaction(SIGALRM, & action, NULL) ; 

fprintf (stdout, "Entrez un nombre entier avant 5 secondes : "); 
if (sigsetjmp(contexte_sigal rm, 1) == 0) { 

/* premier passage, installation */ 

al arm(5) ; 

/* Lecture et analyse de la ligne saisie */ 
while (1) { 

if (fgetsdigne, 79, stdin) != NULL) 
if (sscanfdigne, , & i) == 1) 
break; 

fprintf (stdout, "Un entier svp : "); 

} 

/* Ok - La ligne est bonne */ 
al arm(0) ; 

fprintf(stdout, "Ok !\n"); 
} else { 

/* On est arrive par SIGALRM */ 
fprintf (stdout, "\n Trop tard !\n"); 
exit(EXIT_FAILURE); 



Voici quelques exemples d' execution : 
$ . /exemple_alarm 

Entrez un nombre entier avant 5 secondes : 6 
Ok ! 

$ . /exemple_alarm 

Entrez un nombre entier avant 5 secondes : a 
Un entier svp : z 
Un entier svp : e 
Un entier svp : 8 
Ok ! 

$ . /exempl e_al arm 

Entrez un nombre entier avant 5 secondes : 

Trop tard ! 

$ 



return EXIT_SUCCESS; 
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Nous avons ici un exemple de gestion de delai fiable, fonctionnant avec n'importe quelle 
fonction de bibliotheque ou d'appel systeme risquant de rester bloque indefiniment. Le seul 
inconvenient de ce programme est le risque que le signal SIGALRM se declenche alors que le 
processus est en train d'executer le gestionnaire d'un autre signal (par exemple SIGUSR1). 
Dans ce cas, on ne revient pas au gestionnaire interrompu et ce signal est perdu. 

La seule possibilite pour Feviter est d'ajouter systematiquement SIGALRM dans Fensemble des 
signaux bloques lors de l'execution des autres gestionnaires, c'est-a-dire en l'inserant dans 
chaque champ sajnask des signaux intercepted : 

struct sigaction action; 
action. sa_handler = gestionnaire_sigusrl; 
action.sa_flags = SA_RESTART; 
sigemptyset(& (action. sa_mask)) ; 
sigaddset(& (action. sajnask), SIGALARM); 
sigactiontSIGUSRl, & action, NULL); 

Le signal SIGALRM n'interrompra alors jamais l'execution complete du gestionnaire SIGUSR1. 



Conclusion 

Nous avons etudie dans les deux derniers chapitres Fessentiel de la programmation habituelle 
concernant les signaux. Certaines confusions interviennent parfois a cause d'appels systeme 
obsoletes, qu'on risque neanmoins de rencontrer encore dans certaines applications. 

Des precisions concernant le comportement des signaux sur d' autres systemes sont disponibles 
dans [STEVENS 1993] Advanced Programming in the Unix Environment. La programmation 
portable en utilisant les fonctions Posix (SUSv3 a present) est decrite dans [Lewine 1994] 
Posix Programmer's Guide. 

Le prochain chapitre sera cons acre a un aspect plus moderne des signaux, introduits dans le 
noyau Linux depuis sa version 2.2 : les signaux temps-reel. 
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Avec Linux 2.2 est apparue la gestion des signaux temps-reel. Ceux-ci constituent une 
extension des signaux SIGUSR1 et SIGUSR2, qui presentaient trop de limitations pour des 
applications temps-reel. II faut entendre, par le terme temps-reel, une classe de programmes 
pour lesquels le temps mis pour effectuer une tache constitue un facteur important du 
resultat. Une application temps-reel n'a pas forcement besoin d'etre tres rapide ni de 
repondre dans des delais tres brefs, mais simplement de respecter des limites temporelles 
connues. 

Ceci est bien entendu contraire a tout fonctionnement multitache preemptif, puisque aucune 
garantie de temps de reponse n'est fournie par le noyau. Nous verrons alors qu'il est possi- 
ble de commuter Fordonnancement des processus pour obtenir un sequencement beaucoup 
plus proche d'un veritable support temps-reel. Nous reviendrons sur ces notions dans le 
chapitre 1 1 . 

Les fonctionnalites temps-reel pour les systemes Unix furent introduites par la norme 
Posix.lb et sont decrites de nos jours par l'option RTS de SUSv3 ; leur support par Linux 
elargit le champ des applications industrielles et scientifiques utilisables sur ce systeme 
d' exploitation. 

Les signaux temps-reel presentent done les caracteristiques suivantes par rapport aux signaux 
classiques : 

• nombre plus important de signaux utilisateur ; 

• empilement des occurrences des signaux bloques ; 

• delivrance prioritaire des signaux ; 

• informations supplementaires fournies au gestionnaire. 
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Caracteristiques des signaux temps-reel 
Nombre de signaux temps-reel 

Nous avions deja remarque que le fait de ne disposer que de deux signaux reserves au 
programmeur etait une contrainte importante pour le developpement d' applications utilisant 
beaucoup cette methode de communication. 

La norme Posix.lb reclame la presence d'au moins huit signaux temps-reel. Linux en propose 
trente-deux, ce qui est largement suffisant pour la plupart des situations. 



Attention 

Certaines implementations d'Unix (Solaris par exemple) sont veritablement limitees a huit signaux temps- 
reel, il faudra done etre econome pour les applications voulues portables. 



Les signaux temps-reel n'ont pas de noms specifiques, contrairement aux signaux classiques. 
On peut employer directement leurs numeros, qui s'etendent de SIGRTMIN a SIGRTMAX compris. 
Bien entendu, on utilisera des positions relatives dans cet intervalle, par exemple (SIGRTMIN 
+ 5) ou (SIGRTMAX - 2), sans jamais prejuger de la valeur effective de ces constantes. 

II est de surcroit conseille, pour ameliorer la qualite du code source, de definir des constantes 
symboliques pour nommer les signaux utilises dans le code. Par exemple, on definira dans un 
fichier d'en-tete de F application des constantes : 

#define SIGRTO (SIGRTMIN) 
#define SIGRT1 (SIGRTMIN + 1) 
#define SIGRT2 (SIGRTMIN + 2) 

ou, encore mieux, des constantes dont les noms soient parlants : 

#define S I G_AUTOMATE_P RET (SIGRTMIN + 2) 

#define SIG_ANTENNE_AU_NORD (SIGRTMIN + 4) 
#define SIG_LIAISON_ETABLIE (SIGRTMIN + 1) 

On verifiera egalement que le nombre de signaux temps-reel soit suffisant pour 1' application. 
Toutefois, les valeurs SIGRTMIN et SIGRTMAX peuvent etre implementees sous forme de varia- 
bles, et pas de constantes symboliques. Cette verification doit done avoir lieu durant l'execu- 
tion du programme, pas pendant sa compilation. On emploiera ainsi un code du genre : 

#include <signal .h> 
#include <unistd.h> 

#ifndef _POSIX_REALTIME_SIGNALS 

#error "Pas de signaux temps-reel disponibles" 
#endif 

#define SIGRTO (SIGRTMIN) 
[...] 

#define SIGRT10 (SIGRTMIN + 10) 
#define NB_SIGRT_UTI LES 11 
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int 

main (int argc, char ** argv []) 

{ 

if ((SIGRTMAX - SIGRTMIN + IX N B_S I G RT_UT I L E S ) { 

fprintf (stderr, "Pas assez de signaux temps-reel \n"); 
exi t( EXIT_FAI LURE) ; 

} 

[...] 

} 

Empilement des signaux bloques 

Nous avons vu que les signaux classiques ne sont pas empiles. Cela signifie que si deux 
occurrences d'un meme signal arrivent alors que celui-ci est temporairement bloque, une 
seule d'entre elles sera finalement delivree au processus lors du deblocage. Rappelons que le 
blocage n'intervient pas necessairement de maniere explicite, mais peut aussi se produire 
simplement durant l'execution du gestionnaire d'un autre signal. 

Lorsqu'on veut s'assurer qu'un signal arrivera effectivement a un processus, il faut mettre au 
point un systeme d' acquittement, compliquant serieusement le code. 

Comme un signal est automatiquement bloque durant l'execution de son propre gestionnaire, 
une succession a court intervalle de trois occurrences consecutives du meme signal risque de 
faire disparaitre la troisieme impulsion. Ce comportement n'est pas acceptable des qu'un 
processus doit assurer des comptages ou des commutations d'etat. 

Pour pallier ce probleme, la norme Posix.lb a introduit la notion d' empilement des signaux 
bloques. Si un signal bloque est recu quatre fois au niveau d'un processus, nous sommes sur 
qu'il sera delivre quatre fois lors de son deblocage. 

II existe bien entendu une limite au nombre de signaux pouvant etre memorises simultane- 
ment. Cette limite n'est pas precisee par SUSv3. Sous Linux, on peut empiler 1 024 signaux 
par processus, a moins que la memoire disponible ne soit pas suffisante. L'appel-systeme 
si gqueue( ), que nous verrons plus bas et qui remplace ki 1 1 ( ) pour les signaux temps-reel, 
permet d' avoir la garantie que le signal est bien empile. 

Delivrance prioritaire des signaux 

Lorsque le noyau a le choix entre plusieurs signaux temps-reel a transmettre au processus (par 
exemple lors d'un deblocage d'un ensemble complet), il delivre toujours les signaux de plus 
faible numero en premier. 

Les occurrences de SIGRTMIN seront done toujours transmises en premier au processus, et 
celles de SIGRTMAX en dernier. Cela permet de gerer des priorites entre les evenements repre- 
sented par les signaux. Par contre, SUSv3 ne donne aucune indication sur les priorites des 
signaux classiques. En general, ils sont delivres avant les signaux temps-reel car ils indiquent 
pour le plupart des dysfonctionnements a traiter en urgence (SIGSEGV, SI GILL, SIGHUP. ..), mais 
nous n' avons aucune garantie concernant ce comportement. 

La notion de priorite entre signaux peut neanmoins presenter un inconvenient si on n'y prend 
pas garde. Le revers de la medaille, e'est que les signaux ne sont plus independants, comme 
l'etaient SIGUSR1 et SIGUSR2, par exemple. On pourrait vouloir utiliser deux signaux temps- 
reel pour implementer un mecanisme de bascule, un signal (disons SIGRTMIN+1) demandant 
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le passage a l'etat 1, et 1' autre (SIGRTMIN+2) la descente au niveau 0. On aurait alors une 
sequence representee sur la figure suivante : 

Figure 8.1 l 

Sequence attendue Valeur 



SIGRTMIN+1 SIGRTMIN+2 SIGRTMIN+1 SIGRTMIN+2 SIGRTMIN+1 



Malheureusement, si les signaux sont bloques pendant un moment, ils ne seront pas delivres 
dans l'ordre d'arrivee, mais en fonction de leur priorite. Toutes les impulsions SIGRTMIN+1 
sont delivrees d'abord, puis toutes les impulsions SIGRTMIN+2. 

Figure 8.2 i 

„, Ut Valeur 

Sequence obtenue 



SIGRTMIN+1 SIGRTMIN+1 SIGRTMIN+1 SIGRTMIN+2 SIGRTMIN+2 



Si des evenements lies doivent etre transmis a l'aide des signaux temps-reel, il faut se tourner 
vers une autre methode, en utilisant un seul signal, mais en transmettant une information avec 
le signal lui-meme. 

Informations supplementaires fournies au gestionnaire 

Les signaux temps-reel sont capables de transmettre une - petite - quantite d' information au 
gestionnaire associe. Cette information est contenue dans une valeur de type union sigval. 
Cette union peut prendre deux formes : 

• un entier i nt, en employant son membre si gval_i nt ; 

• un pointeur voi d *, avec le membre si gval_ptr. 
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Nous avons deja evoque la forme du gestionnaire de signaux temps-reel dans le chapitre prece- 
dent, dans le paragraphe traitant de l'attribut SA_SIGINFO dans le champ sa_f 1 ags de si gaction. 

void gestionnaire_signal (int numero, 

struct siginfo * info, 
void * inutile); 

Le troisieme argument de cette routine n'est pas defini de maniere portable. Certains 
systemes Unix l'utilisent, mais apparemment le noyau Linux n'en fait pas usage. Toutes les 
informations supplementaires se trouvent dans la structure siginfo sur laquelle un pointeur 
est transmis en deuxieme argument. 

Pour que ce gestionnaire soit installe, il faut le placer dans le membre sa_sigaction de la 
structure si gaction, et non plus dans le membre sa_handler. De meme, le champ sa_flags 
doit contenir l'attribut SA_SIGINFO. 

L initialisation se fait done ainsi : 
struct sigaction action; 



acti on. sa_si gaction = gestionnai re_signal_temps_reel ; 
sigemptyset(& action . sa_mask); 
action. sa_flags = SA_SIGINFO; 

if (sigactiontSIGRTMIN + 1, & action, NULL) < 0) { 
perrorC'sigaction") ; 
exit(EXIT_FAILURE); 

} 



Emission d un signal temps-reel 

Bien sur, si on desire transmettre des donnees supplementaires au gestionnaire de signaux, il 
ne suffit plus d'employer la fonction killO habituelle. II existe un nouvel appel-systeme, 
nomme sigqueue( ), defini par SUSv3 : 

int sigqueue (pid_t pid, int numero, const union sigval valeur) 

Les deux premiers arguments sont equivalents a ceux de ki 1 1 ( ), mais le troisieme correspond 
au membre si_sigval de la structure siginfo transmise au gestionnaire de signaux. 

II n'y a aucun moyen dans le gestionnaire de determiner si 1' argument de type union sigval 
a ete rempli, lors de l'invocation de sigqueue( ) avec une valeur entiere (champ si gval_i nt) 
ou un pointeur (champ sigval_ptr). II est done necessaire que l'application reste coherente 
entre 1' envoi du signal et sa reception. Lorsque le signal est transmis entre deux processus 
distincts, on ne peut bien sur passer que des valeurs entieres, un pointeur n'ayant pas de signi- 
fication dans Fespace d'adressage de Fautre processus. 



II y a peu de situations ou le passage d'un pointeur associe a un signal se justifie. On peut penser aux threads 
qui partagent leur espace memoire, mais egalement aux cas ou le processus s'envoie lui-meme un signal 
differe. Nous verrons dans le chapitre 30 que Ton peut programmer une operation d'entree-sortie asynchrone 
(par exemple une ecriture en arriere-plan) et etre averti lorsqu'elle est terminee par I'arrivee d'un signal afin de 
verifier que tout s'est bien passe. Dans cette situation on peut associer au signal un pointeur sur une structure 
de donnees decrivant I'operation afin d'avoir toutes les informations necessaires dans le gestionnaire invoque. 
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Recapitulons les principaux champs de la structure siginfo recue par le gestionnaire de 
signaux : 





Norn membre 


Type 


Posix.lb Signification 


si. 


_signo 


i nt 


Numero du signal, redondant avec le premier argument de 
I'appel du gestionnaire. 


si. 


_code 


i nt 


Voir ci-dessous. 


S 1 


_valu6.sigval_int 




• Entierdelunion passee endernierargumentde sigc|ueue(). 


si. 


_value.sigval_ptr 


void * 


• Pointeurde I'union passee en dernier argument de sigqueuet ). 

Np Hn it n3"? Ptrp pmnlnvp ^imi iltanpmpnt 3\/pr lp mpmhrp 
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precedent. 


si. 


_errno 


i nt 


Valeur de la variable globale errno lors du declenchement du 
gestionnaire. Permet de retablir cette valeur en sortie. 


si. 


_pid 


pid_t 


PID du processus fils s'etant termine si le signal est SIGCHLD. 
PID de I'emetteur si le signal est temps-reel. 


si. 


_uid 


uid_t 


UID reel de I'emetteur d'un signal temps-reel ou celui du 
processus fils termine si le signal est SIGCHLD. 


si. 


_status 


i nt 


Code de retour du processus fils termine, uniquement avec le 
signal SIGCHLD. 



La signification du champ si_code varie suivant le type de signal. Pour les signaux temps-reel 
ou pour la plupart des signaux classiques, si_code indique l'origine du signal : 





Valeur 


Provenance du signal Posix.lb 


SI. 


.KERNEL 


Signal emis par le noyau 


SI. 


.USER 


Appel-systeme killOouraiseO 


SI. 


.QUEUE 


Appel-systeme sigqueue( ) 


SI. 


.ASYNCIO 


Terminaison d'une entree-sortie asynchrone 


SI. 


.MESGQ 


Changement d'etat d'une file de message temps-reel 
(non implemente sous Linux) 


SI. 


.SIGIO 


Changement d'etat sur un descripteur d'entree-sortie asynchrone 


SI. 


.TIMER 


Expiration d'une temporisation temps-reel (non implementee sous Linux) 



Pour un certain nombre de signaux classiques, Linux fournit egalement des donnees (princi- 
palement utiles au debogage) dans le champ si_code, si le gestionnaire est installe en utilisant 
SA_SI GI N FO dans l'argument sa_flags de sigaction : 



Signal SIGBUS 


BUS. 


.ADRALN 


Erreur d'alignement d'adresse. 


BUS. 


.ADRERR 


Adresse physique invalide. 


BUS. 


.OBJERR 


Erreur d'adressage materiel. 
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Signal SIGCHLD 



CLD_CONTINUED 


Un fils arrete a redemarre (ce code n'est effectivement implements dans le noyau que depuis 
Linux 2.6.9). 


CLD_DUMPED 


Un fils s'est termine anormalement. 


CLD_EXITED 


Un fils vient de se terminer normalement. 


CLD_KILLED 


Un fils a ete tue par un signal. 


CLD_STOPPED 


Un fils a ete arrete. 


CLD_TRAPPED 


Un fils a atteint un point d'arret. 


Signal SIGFPE 


FPE_FLTDIV 


Division en virgule flottante par zero. 


FPE_FLTINV 


Operation en virgule flottante invalide. 


FPE_FLTOVF 


Debordement superieur lors d'une operation en virgule flottante. 


FPE_FLTRES 


Resultat faux lors d'une operation en virgule flottante. 


FPE_FLTSUB 


elevation a une puissance invalide. 


FPE_FLTUND 


Debordement inferieur lors d'une operation en virgule flottante. 


FPE_INTDIV 


Division entiere par zero. 


FPE_INTOVF 


Debordement de valeur entiere. 


Signal SIGILL 


ILL_BADSTK 


Erreur de pile. 


ILL_COPROC 


Erreur d'un coprocesseur. 


I LL_I LLADR 


Mode d'adressage illegal. 


ILL_ILLOPC 


Code d'operation illegal. 


ILL_ILLOPN 


Operande illegale. 


I LL_I LLTRP 


Point d'arret illegal. 


ILL_PRVOPC 


Code d'operation privilegie. 


ILL_PRVREG 


Acces a un registre privilegie. 


Signal SIGPOLL 


P0LL_ERR 


Erreur d'entree-sortie. 


POLLJUP 


Deconnexion du correspondant. 


P0LL_IN 


Donnees pretes a etre lues. 


P0LL_MSG 


Message disponible en entree. 


P0LL_0UT 


Zone de sortie disponible. 


P0LL_PRI 


Entrees disponibles a haute priorite. 




SEGV_ACCERR 


Acces interdit a la projection memoire. 


SEGV_MAPERR 


Adresse sans projection memoire. 


Signal SIGTRAP 


TRAP_BRKPT 


Point d'arret de debogage. 


TRAP_TRACE 


Point d'arret de profilage. 
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Attention 

Tous ces codes sont specifiques a Linux et ne doivent pas etre employes dans une application portable. En 
outre, ils sont tous declares dans les fichiers d'en-tete de Linux, mais ils ne sont pas tous reellement renvoyes 
par le noyau. 



A la lecture du premier tableau, concernant les champs si_code generaux, nous remarquons 
plusieurs choses : 

• II est possible d'envoyer un signal temps-reel avec l'appel-systeme ki 1 1 ( ). Simplement, 
les informations supplementaires ne seront pas disponibles. Leur valeur dans ce cas n'est 
pas precisee par SUSv3, mais sous Linux, le champ de type sigval correspondant est mis 
a zero. II est done possible d'employer les signaux temps-reel en remplacement pur et 
simple de SIGUSR1 et SIGUSR2 dans une application deja existante, en profitant de 
Fempilement des signaux, mais en restant conscient du probleme que nous avons evoque, 
concernant la priori te de delivrance. 

• II existe un certain nombre de sources de signaux temps-reel possibles, en supplement de 
la programmation manuelle avec sigqueueO ou killO. Plusieurs fonctionnalites intro- 
duites par la norme Posix.lb permettent en effet a 1' application de programmer un travail 
et de recevoir un signal lorsqu'il est accompli. C'est le cas, par exemple, des files de 
messages utilisant les fonctions mq_open( ), mq_cl ose( ), mqjioti fy ( ), ou encore des tempo- 
risations programmers avec timer_create( ), timer_del ete( ) et timer_settime( ). 

Nous allons commencer par creer un programme servant de frontal a sigqueueO, comme 
l'utilitaire systeme /bi n/ ki 1 1 pouvait nous servir a invoquer l'appel-systeme ki 1 1 ( ) depuis la 
ligne de commande. 

exemple_sigqueue.c : 

//include <signal .h> 
//include <stdio.h> 
//include <stdlib.h> 
//include <unistd.h> 

void 

syntaxe (const char * nom) 
{ 

fprintf (stderr, "syntaxe %s signal pid...\n", nom); 
exit(EXIT_FAILURE); 

} 

int 

main (int argc, char * argv []) 
{ 

int i; 

int numero; 

int pid; 

union sigval valeur; 

if (argc == 1) 

syntaxe(argv[0] ) ; 
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1 = 1; 

if (argc == 2) { 

numero = SIGTERM; 
} else { 

if (sscanf (argv[i ] , "%&" , & numero) != 1) 

syntaxe(argv[0]) ; 
i ++; 

} 

if ((numero < 0) | | (numero > NSIG - 1)) 

syntaxe(argv[0]) ; 
valeur.sival_int = 0; 
for ( ; i < argc; i ++) { 

if (sscanf(argv[i], "%d". & pid) != 1) 

syntaxe(argv[0]) ; 
if (sigqueue( (pid_t) pid, numero, valeur) < 0) 
fprintf (stderr, "%d : ", pid); 
perror (""); 



return EXIT_SUCCESS; 



A present, nous allons creer un programme qui installe un gestionnaire de type temps-reel 
pour tous les signaux - meme les signaux classiques - pour afficher le champ si_code de leur 
argument de type si gi nf o. 

exemple_siginfo.c : 

#include <signal .h> 

#include <stdio.h> 

finclude <stdlib.h> 

#include <unistd.h> 

void 

gestionnaire (int numero, struct siginfo * info, void * inutilise) 
{ 

fprintf (stderr, "Recu %d\n" , numero); 
fprintf (stderr, " si_code = %d\n" , info->si_code) ; 



int 
main (void) 

{ 

int i; 
struct sigaction action; 
char chaine[5]; 



action. sa_sigaction = gestionnaire; 
action. sa_flags = SA_SIGINF0; 
sigemptyset(& action. sa_mask) ; 
fprintf(stderr, "PID=21d\n" . (long) getpidO); 
for (i = 1; i < NSIG; i ++) 
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if (sigactiond , & action, NULL) < 0) 

fprintf (stderr, "%d non intercepts \n", i); 
while (1) 

fgets(chaine, 5, stdin); 
return EXIT_SUCCESS ; 

} 

Finalement, nous lancons le programme exempl e_siginfo, puis nous lui envoyons des signaux 
depuis une autre console (representee en seconde colonne), en utilisant tantot /bin/kill, 
tantot exempl e_si gqueue. 

$ . /exempl e_siginfo 

PID=1069 

9 non intercepts 
19 non intercepts 

$ kill -33 1069 

Recu 33 
si_code = 0 

$ . /exempl e_si gqueue 33 1069 

Recu 33 
si_code = -1 

$ kill -TERM 1069 

Recu 15 
si_code = 0 

$ kill -KILL 1069 

Ki 1 1 ed 
$ 

Le champ si_code correspond bien a 0 (valeur de SIJJSER) ou a -1 (valeur de SIJ3UEUE) 
suivant le cas. 



Attention 

Si on utilise I'appel-systeme alarmOpour declencher SIGALRM, le champ si_code est rempli avec la 
valeur SIJJSER et pas avec SIJIMER, qui est reservee aux temporisations temps-reel. 



Notre second exemple va mettre en evidence a la fois l'empilement des signaux temps-reel et 
leur respect d'une priorite. Notre programme va en effet bloquer tous les signaux, s'en 
envoyer une certaine quantite, et voir dans quel ordre ils arrivent. La valeur sigval associee 
aux signaux permettra de les reconnaltre. 

exemple_sigqueue_1.c : 

//include <signal .h> 
//include <stdio.h> 
//include <unistd.h> 

int signaux_arrives[10] ; 
int valeur_arrivee[10]; 
int nb_signaux = 0; 
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void 

gestionnai re_signal_temps_reel (int numero, 

siginfo_t * info, void * inutile) 

{ 

signaux_arrives[nb_signaux] = numero - SIGRTMIN ; 

valeur_arrivee[nb_signaux] = info->si_value.sival_int; 
nb_signaux ++; 



void 

envoie_signal_temps_reel (int numero, int valeur) 
{ 

union sigval valeur_sig; 

fprintf(stdout, "Envoi signal SIRTMIN+%d, valeur £d\n", 

numero, valeur); 
valeur_sig.sival_int = valeur; 

if (sigqueue(getpid( ) , numero + SIGRTMIN, valeur_sig) < 0) { 
perror( "sigqueue" ) ; 
exi t( EXIT_FAI LURE) ; 

} 



int 
main (void) 

{ 

struct sigaction action; 
sigset_t ensemble; 
int i; 



fprintf (stdout, "Installation gestionnai res de signaux \n"); 
action. sa_sigaction = gestionnai re_signal_temps_reel ; 
sigemptyset(& action. sajnask) ; 
action. sa_flags = SA_SIGINF0; 
if ((sigaction(SIGRTMIN + 1, & action, NULL) < 0) 
|| (sigaction(SIGRTMIN + 2, & action, NULL) < 0) 
|| (sigaction(SIGRTMIN + 3, & action, NULL) < 0)) { 
perrorC'sigaction") ; 
exi t(EXIT_FAI LURE); 

} 

fprintf (stdout, "Blocage de tous les signaux \n"); 
si gf i 1 1 set{& ensemble); 
sigprocmask(SIG_BLOCK, & ensemble, NULL); 



envoi e_signal_temps_reel (1, 0) 

envoi e_signal_temps_reel (2, 1) 

envoi e_signal_temps_reel (3, 2) 

envoi e_signal_temps_reel (1, 3) 

envoie_signal_temps_reel (2, 4) 

envoi e_signal_temps_reel (3, 5) 

envoi e_signal_temps_reel (3, 6) 

envoie_signal_temps_reel (2, 7) 
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envoi e_signal_temps_reel (1, 8); 
envoi e_signal_temps_reel (3, 9); 

fprintf (stdout, "Deblocage de tons les signaux \n"); 
sigfillset(& ensemble); 
sigprocmask(SIG_UNBLOCK, & ensemble, NULL); 

fprintf (stdout, "Affichage des resultats \n"); 
for (i = 0; i < nb_signaux; i ++) 

fprintf(stdout, "Signal SIGRTMI N+%d , valeur %d\n", 

signaux_arrives[i] , valeur_arrivee[i]) ; 

fprintf (stdout, "Fin du programme \n"); 
return EXIT_SUCCESS; 

} 

Notre gestionnaire stocke les signaux arrivant dans une table qui est affichee par la suite, pour 
eviter les problemes de concurrence sur Faeces au flux stdout. 

$ ./exemple_sigqueue_l 

Installation gestionnaires de signaux 
Blocage de tous les signaux 

Envoi signal SI RTMIN+1 , valeur 0 

Envoi signal SIRTMIN+2 , valeur 1 

Envoi signal SIRTMIN+3 , valeur 2 

Envoi signal SI RTMIN+1 , valeur 3 

Envoi signal SIRTMIN+2, valeur 4 

Envoi signal SIRTMIN+3, valeur 5 

Envoi signal SIRTMIN+3, valeur 6 

Envoi signal SIRTMIN+2, valeur 7 

Envoi signal SI RTMIN+1 , valeur 8 

Envoi signal SIRTMIN+3, valeur 9 

Deblocage de tous les signaux 



Affichage des resultats 




Signal 


SIGRTMIN+1, 


val eur 


0 


Signal 


SIGRTMIN+1, 


val eur 


3 


Signal 


SIGRTMIN+1, 


val eur 


8 


Signal 


SIGRTMIN+2, 


val eur 


1 


Signal 


SIGRTMIN+2, 


val eur 


4 


Signal 


SIGRTMIN+2, 


val eur 


7 


Signal 


SIGRTMIN+3, 


val eur 


2 


Signal 


SIGRTMIN+3, 


val eur 


5 


Signal 


SIGRTMIN+3, 


val eur 


6 


Signal 


SIGRTMIN+3, 


val eur 


9 


Fin du 


programme 







$ 

Nous remarquons bien que les signaux sont delivres suivant leur priorite : tous les SI RTMIN+1 
en premier, suivis des SIGRTMIN+2, puis des SIGRTMIN+3. De meme, au sein de chaque classe, 
les occurrences des signaux sont bien empilees et delivrees dans l'ordre chronologique 
d' emission. 
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Traitement rapide des signaux temps-reel 

La norme SUSv3 donne acces a des possibilites de traitement rapide des signaux. Ceci ne 
concerne que les applications qui attendent passivement l'arrivee d'un signal pour agir. Cette 
situation est assez courante lorsqu'on utilise les signaux comme une methode pour imple- 
menter un comportement multitache au niveau applicatif. 

Avec le traitement classique des signaux, nous utilisions quelque chose comme : 

si gf i 1 1 set ( & tous_signaux) ; 
sigprocmask(SIG_BLOCK, & tous_signaux, NULL); 
sigemptyset(& aucun_signal ) ; 
while (! fin_programme) 

sigsuspend(& aucun_signal ) ; 

Lorsqu'un signal arrive, le processus doit alors etre active par l'ordonnanceur, ensuite l'exe- 
cution est suspendue, le gestionnaire de signaux est invoque, puis le controle revient au fil 
courant d'execution, qui termine la fonction sigsuspend( ). La boucle reprend alors. 

Le probleme est que l'appel du gestionnaire par le noyau necessite un changement de 
contexte, tout comme le retour de ce gestionnaire. Ceci est plus couteux qu'un simple appel 
de fonction usuel. 

Deux appels-systeme, definis dans la norme Posix.lb, ont done fait leur apparition avec le 
noyau Linux 2.2. II s'agit de sigwaitinfo( ) et de sigtimedwait( ). Ce sont en quelque sorte 
des extensions de sigsuspend( ). lis permettent d'attendre l'arrivee d'un signal dans un 
ensemble precis. A la difference de sigsuspend( ), lorsqu'un signal arrive, son gestionnaire 
n'est pas invoque. A la place, l'appel-systeme sigwaitinfo( ) ou sigtimedwait( ) se termine 
en renvoyant le numero de signal recu. II n'est plus necessaire d'effectuer des changements de 
contexte pour executer le gestionnaire, il suffit d'une gestion directement integree dans le fil 
du programme (la plupart du temps en utilisant une construction switch-case). Si le processus 
doit appeler le gestionnaire, il le fera simplement comme une fonction classique, avec toutes 
les possibilites habituelles d' optimisation par insertion du code en ligne. 

Comme prevu, sigtimedwai t( ) est une version temporisee de sigwai tinfo( ), qui echoue avec 
une erreur E AGAIN si aucun signal n'est arrive pendant le delai imparti : 

int sigwaitinfo (const sigset_t * signaux_attendus , siginfo_t * info); 
int sigtimedwait (const sigset_t * signaux_attendus , siginfo_t * info, 
const struct timespec * delai); 

De plus, ces fonctions offrent 1' acces aux donnees supplementaires disponibles avec les signaux 
temps-reel. 



Attention 

sigsuspendO prenait en argument I'ensemble des signaux bloques, sigwaitinfo( ) comme sigti- 
medwai t( ) reclament I'ensemble des signaux attendus. 
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La structure timespec utilisee pour programmer le delai offre les membres suivants : 



Type 


Nom 


Signification 


long 


tv_sec 


Nombre de secondes 


long 


tv_nsec 


Nombre de nanosecondes 



La valeur du champ tv_nsec doit etre comprise entre 0 et 999.999.999, sinon le comporte- 
ment est indefini. 

Les appels-systeme sigwaitinfo( ) ou sigtimedwait( ) peuvent echouer avec l'erreur EINTR si 
un signal non attendu est arrive et a ete traite par un gestionnaire. Si leur second argument est 
NULL, aucune information n'est stockee. 

II est important de bloquer avec si gprocmask( ) les signaux qu'on attend avec si gwai ti nf o( ) 
ou si gtimedwai t( ), car cela assure qu'aucun signal impromptu n'arri vera juste avant ou apres 
l'invocation de l'appel-systeme. 

Notre premier exemple va consister a installer un gestionnaire normal pour un seul signal, 
SIGRTMIN+1, pour voir le comportement du systeme avec les signaux non attendus. Ensuite, on 
bloque tous les signaux, puis on les attend tous, sauf SIGRTMIN+1 et SIGKILL. Nous explique- 
rons plus bas pourquoi traitor SIGKI LL specifiquement. 

exemple sigwaitinfo.c : 

//include <stdio.h> 
//include <stdlib.h> 
//include <signal .h> 
//include <unistd.h> 

void 

gestionnaire (int numero, struct siginfo * info, void * inutile) 
{ 

fprintf (stderr, "gestionnaire : Id regu \n", numero); 

} 

int 
main (void) 
{ 

sigset_t ensemble; 

int numero; 

struct sigaction action; 

fprintf (stderr, "PID=%u\n" , getpidO); 

/* Installation gestionnaire pour SIGRTMIN+1 */ 

action. sa_sigaction = gestionnaire; 

action. sa_flags = SA_SIGINFO; 

sigemptyset(& action. sa_mask); 

sigaction(SIGRTMIN + 1, & action, NULL); 

/* Blocage de tous les signaux sauf SIGRTMIN+1 */ 

sigfillset(& ensemble); 

sigdelset(& ensemble, SIGRTMIN + 1); 

sigprocmask(SIG_BLOCK, & ensemble, NULL); 
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/* Attente de tous les signaux sauf RTMIN+1 et SIGKILL */ 

si gf i 1 1 set (& ensemble); 

sigdelset(& ensemble, SIGRTMIN + 1); 

sigdelse (& ensemble, SIGKILL) ; 

while (1) { 

if ((numero = sigwaitinfo(& ensemble, NULL)) < 0) 
perrorC'sigwaitinfo"); 

el se 

fprintf (stderr, "sigwaitinfo : %d regu \n", numero); 

} 

return EXIT_SUCCESS; 

} 

Nous ne traitons pas reellement les signaux recus, nous contentant d'afficher leur numero, 
mais nous pourrions tres bien inserer une sequence switch-case au retour de sigwaitinfot ). 
II faut bien comprendre que le signal dont le numero est renvoye par sigwaitinfo( ) est 
completement elimine de la liste des signaux en attente. La structure siginfo est egalement 
remplie lors de l'appel-systeme si des informations sont disponibles. 

Voici un exemple d' execution avec, en seconde colonne, les actions saisies depuis une autre 
console : 

$ . /exemple_sigwaitinfo 

PID=1435 

sigwaitinfo : 1 recu 

sigwaitinfo : 15 regu 

gestionnaire : 33 regu 
sigwaitinfo: Appel systeme 

Killed 
$ 

Nous remarquons que lorsqu'un signal non attendu est recu, il est traite normalement par son 
gestionnaire, et l'appel-systeme sigwaitinfot ) est interrompu et echoue avec l'erreur EINTR. 



$ kill -HUP 1435 

$ kill -TERM 1435 

$ kill -33 1435 

interrompu 

$ kill -KILL 1435 



Conclusion 

Nous avons examine dans ce chapitre une extension importante des methodes de traitement 
des signaux. Ces fonctionnalites temps-reel ajoutent une dimension considerable aux capa- 
cites de Linux a traiter des problemes industriels ou scientifiques avec des delais critiques. 

La norme Posix.lb, quand elle s'appelait encore Posix.4, a ete etudiee en detail dans [GALL- 
MEISTER 1995] Posix.4 Programming for the real world. 
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Nous allons etudier dans la premiere partie de ce chapitre les methodes permettant d'endormir 
un processus pendant une duree plus ou moins precise. Nous aborderons ensuite les moyens 
de suivre F execution d'un programme et d'obtenir des informations statistiques le concernant. 
Naturellement, nous examinerons aussi les fonctions de limitation des ressources, permettant 
de restreindre l'utilisation du systeme par un processus. 

Endormir un processus 

La fonction la plus simple pour endormir temporairement un processus est sleep( ) , qui est 
declaree ainsi dans <uni std . h> : 

unsigned int sleep (unsigned int nb_secondes ) ; 

Cette fonction endort le processus pendant la duree demandee et revient ensuite. A cause de 
la charge du systeme, il peut arriver que si eep( ) dure un peu plus longtemps que prevu. De 
meme, si un signal interrompt le sommeil du processus, la fonction sleep( ) revient plus tot 
que prevu, en renvoyant le nombre de secondes restantes sur la duree initiale. 

Notez que sleepO est une fonction de bibliotheque, qui n'est done pas concernee par 
Fattribut SA_RESTART des gestionnaires de signaux, qui ne sert a relancer que les appels- 
systeme lents. 

Voici un exemple dans lequel deux processus executent un appel a si eep( ). Le processus pere 
dort deux secondes avant d' envoy er un signal a son fils. Ce dernier essaye de dormir 
10 secondes, mais sera reveille plus tot par le signal. On invoque la commande systeme 
« date » pour afficher l'heure avant et apres l'appel si eep( ). On presente egalement la duree 
restante : 
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exemple_sleep.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <signal .h> 
#include <unistd.h> 
#include <sys/wait.h> 

void 

gestionnaire_sigusrl(int numero) 
{ 

} 

int 
main (void) 
{ 

pid_t pid; 

unsigned int duree_sommei 1 ; 

struct sigaction action; 

if ((pid = forkO) < 0) { 

fprintf (stderr, "Erreur dans fork \n"); 
exit(EXIT_FAILURE); 

} 

action. sa_handler = gestionnaire_sigusrl; 
sigemptyset(& action. sa_mask) ; 
action.sa_flags = SA_RESTART; 

if (sigaction(SIGUSRl, & action, NULL) != 0) { 
fprintf (stderr, "Erreur dans sigaction \n"); 
exit(EXIT_FAILURE); 

} 

if (pid == 0) { 

systemC'date +\"XH:%M:%S\""); 
duree_sommei 1 = sleep(lO); 
systemCdate +\"XH:%M:%S\"" ) ; 

fprintf (stdout, "Duree restante ^u\n", duree_sommei 1 ) ; 
} else { 

sleep(2) ; 

km (pid. SIGUSR1); 
waitpid(pid, NULL, 0); 

} 

return EXIT_SUCCESS; 

} 

Voici un exemple d' execution : 

$ ./exemple_sleep 

12:31:19 
12:31:21 

Duree restante 8 
$ 
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La fonction sleepO etant implemented a partir de l'appel-systeme alarmO, il est vraiment 
deconseille de les utiliser ensemble dans la meme portion de programme. La bibliotheque 
GlibC implemente sleepO en prenant garde aux eventuelles interactions avec une alarme 
deja programmed, mais ce n'est pas forcement le cas sur d'autres systemes sur lesquels on 
peut etre amene a porter le programme. 

De meme, si un signal arrive pendant la periode de sommeil et si le gestionnaire de ce signal 
modifie le comportement du processus vis-a-vis de SI GALRM, le resultat est totalement impre- 
visible. Egalement, si le gestionnaire de signaux se termine par un saut non local siglong- 
jmp( ), le sommeil est definitivement interrompu. 

Lorsqu'on desire assurer une duree de sommeil assez precise malgre le risque d' interruption 
par un signal, on pourrait etre tente de programmer une boucle du type : 

void 

sommeil (unsigned int duree_initiale) 

{ 

unsigned int duree_restante = duree_initiale; 

while (duree_restante > 0) 

duree_restante = si eep(duree_restante) ; 

} 

Malheureusement, ceci ne fonctionne pas, car lors d'une invocation de la fonction si eep( ) si 
un signal se produit au bout d'un dixieme de seconde par exemple, la duree renvoyee sera 
quand meme decremented d'une seconde complete. Si ce phenomene se produit a plusieurs 
reprises, un decalage certain peut se produire en fin de compte. Pour l'eviter, il faut recadrer 
la duree de sommeil regulierement. On peut par exemple utiliser l'appel-systeme time( ), qui 
est defini dans <time.h> ainsi : 

| time_t time (time_t * t); 

Cet appel-systeme renvoie l'heure actuelle, sous forme du nombre de secondes ecoulees 
depuis le l er janvier 1970 a 0 heure GMT. De plus, si t n'est pas un pointeur NULL, cette valeur 
y est egalement stocked. Le format time_t est compatible avec un unsigned long. Nous 
reviendrons sur les fonctions de traitement du temps dans le chapitre 25. 

Voici un exemple de routine de sommeil avec une duree precise : 
void 

sommeil (unsigned int duree_initiale) 

{ 

time_t heure_fin; 
time_t heure_actuelle; 

heure_fin = time(NULL) + duree_initiale; 

while ((heure_actuelle = time(NULD) < heure_fin) 
sleep(heure_fin - heure_actuel 1 e) ; 

} 

Cette routine peut quand meme durer un peu plus longtemps que prevu si le systeme est tres 
charge, mais elle restera precise sur des longues durees, meme si de nombreux signaux sont 
re5us par le processus. 
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Si on desire avoir une resolution plus precise que la seconde, la fonction usl eep( ) est dispo- 
nible. II faut imaginer que le « u » represente en realite le « |0. » de microseconde. Le prototype 
de cette fonction est declare dans <uni std . h> ainsi : 

void usleep (unsigned long nb_micro_secondes) ; 

L'appel endort le processus pendant le nombre indique de microsecondes, a moins qu'un 
signal ne soit recu entre-temps. La fonction usleep( ) ne renvoyant pas de valeur, on ne sait 
pas si la duree voulue s'est ecoulee ou non. Cette fonction est implemented dans le biblio- 
theque GlibC en utilisant l'appel-systeme sel ect( ), que nous verrons dans le chapitre consacre 
aux traitements asynchrones. 

Voici une variante du programme precedent, utilisant usl eep( ). Nous allons montrer que cette 
fonction peut aussi etre interrompue par l'arrivee d'un signal. 

exemple_usleep.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <signal .h> 
#include <unistd.h> 
^include <sys/wait.h> 

void 

gestionnaire_sigusrl(int numero) 
{ 

} 

int 
main (void) 
{ 

pid_t pid; 
struct sigaction action; 

if ((pid = forkO) < 0) { 

fprintf (stderr, "Erreur dans fork \n"); 
exit(EXIT_FAILURE); 

} 

action. sa_handler = gestionnaire_sigusrl; 
sigemptyset(& action. sa_mask) ; 
action.sa_flags = SA_RESTART; 

if (sigaction(SIGUSRl, & action, NULL) ! = 0) { 
fprintf (stderr, "Erreur dans sigaction \n"); 
exit(EXIT_FAILURE); 

} 

if (pid == 0) { 

systemCdate +\"^H:%M:%S\"" ) ; 

usleep(lOOOOOOO); /* 10 millions de us = 10 secondes */ 
systemCdate +\"^H:%M:^S\"" ) ; 
} else { 

usleep(2000000) ; /* 2 millions de us = 2 secondes */ 
kilKpid, SIGUSR1); 
waitpid(pid, NULL, 0); 
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return EXIT_SUCCESS; 

I > 

Le sommeil du processus fils, cense durer 10 secondes, est interrompu au bout de 2 secondes 
par le signal provenant du pere, et ce malgre l'option SA_RESTART de sigaction( ), comme le 
montre l'execution suivante : 

$ ./exemple_usleep 

08:42:34 
08:42:36 
$ 

La fonction usleepO etant implementee a partir de l'appel-systeme selectO, elle n'a pas 
d'interaction inattendue avec un eventuel gestionnaire de signaux (sauf si ce dernier se 
termine par un saut si gl ongjmp( ) bien entendu). 

II existe encore une autre fonction de sommeil, offrant une precision encore plus grande : 
nanosleepO. Cette fonction est definie par SUSv3. Elle est declaree ainsi dans <time.h> : 

int nanosleep (const struct timespec * voulu, struct timespec * restant); 

Le premier argument represente la duree de sommeil desiree, et le second argument, s'il est 
non NULL, permet de stocker la duree de sommeil restante lorsque la fonction a ete inter- 
rompue par l'arrivee d'un signal. Si nanosl eep( ) dort pendant la duree desiree, elle renvoie 0. 
En cas d'erreur, ou si un signal la reveille prematurement, elle renvoie -1 (et place EI NTR dans 
errno dans ce dernier cas). 

La structure timespec servant a indiquer la duree de sommeil a ete decrite dans le chapitre 
precedent, avec l'appel-systeme sigwaitinfo( ). Elle contient deux membres : l'un precisant 
le nombre de secondes, F autre contenant la partie fractionnaire exprimee en nanosecondes. 

II est illusoire d'imaginer avoir une precision de l'ordre de la nanoseconde, ou meme de la 
microseconde, sur un systeme multitache. Meme sur un systeme monotache dedie a une 
application en temps-reel, il est difficile d'obtenir une telle precision sans avoir recours a des 
boucles d'attente vides, ne serait-ce qu'en raison de l'allongement de duree du a l'appel- 
systeme proprement dit. 

Quoi qu'il en soit, l'ordonnancement est soumis au sequencement de l'horloge interne, dont 
les intervalles sont separes de 1/HZ seconde. La constante HZ est definie dans <asm/param. h>. 
Elle varie suivant les machines et les versions du noyau : depuis Linux 2.6, elle vaut 1000 sur 
les architectures x86 alors qu'auparavant elle valait 100. Ainsi un sommeil de processus est 
toujours arrondi a la milliseconde superieure (au centieme de seconde superieur pour les 
noyaux 2.4 et precedents). 

Bien que la precision de cette fonction soit illusoire, elle presente quand meme un gros avan- 
tage par rapport aux deux precedentes. La fonction usleepO ne renvoyait pas la duree de 
sommeil restante en cas d' interruption, si eep( ), nous l'avons vu, arrondissait cette valeur a la 
seconde superieure, mais la pseudo-precision de nanosl eep( ) permet de reprendre le sommeil 
interrompu en la rappelant directement avec la valeur de sommeil qui restait. Le calibrage 
a 1/HZ seconde (soit 1 millieme de seconde sur les machines x86) permet de conserver une 
relative precision, meme en cas de signaux frequents. Dans le programme suivant, on va 
effectuer un sommeil de 60 secondes pendant lequel, le processus recevra chaque seconde 
cinq signaux (disons plutot qu'il en recevra plusieurs, car certains seront certainement 
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regroupes). A chaque interruption, nanosleep( ) est relancee avec la duree restante, avec une 
pseudo precision a la nanoseconde. 

exemplejianosleep.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <signal .h> 
#include <time.h> 
#include <unistd.h> 
#1nclude <sys/wait.h> 



void 

gestionnai re_sigusrl(int numero) 
{ 

} 

int 
main (void) 
{ 

pid_t pid; 
struct sigaction action; 
struct timespec spec; 
int i; 



if ((pid = forkO) < 0) { 

fprintf (stderr, "Erreur dans fork \n"); 
exit(EXIT_FAILURE); 

} 

action. sa_handler = gestionnaire_sigusrl; 
sigemptyset (& (action.sa_mask)); 
action. sa_flags = SA_RESTART; 

if (sigaction(SIGUSRl, & action, NULL) != 0) { 
fprintf (stderr, "Erreur dans sigaction \n"); 
exit(EXIT_FAILURE); 

} 

if (pid == 0) { 

spec.tv_sec = 60; 

spec.tv_nsec = 0; 

systemCdate +\"*H:%M:%S\"") ; 

while (nanosleep(& spec, & spec) != 0) 

systemCdate +\"%\\:%H:%SV" ) ; 
} else { 

sleep(2); /* Pour eviter d'envoyer un signal pendant */ 
/* l'appel systemO a /bin/date */ 
for (i = 0 ; i < 59; 1 ++) { 
sleep(l) ; 

ki 11 (pid , SIGUSR1); 
ki 11 (pid . SIGUSR1); 
kill (pid, SIGUSR1); 
kill (pid. SIGUSR1); 
kill (pid. SIGUSR1); 
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} 

waitpid(pid, NULL, 0); 

} 

return EXIT_SUCCESS; 

} 

L' execution suivante nous montre qu'a un niveau macroscopique (la seconde), la precision est 
conservee, meme sur une duree relativement longue comme une minute, avec une charge 
systeme assez faible. 

$ ./exemple_nanosleep 

13:04:05 
13:05:05 

Bien sur dans notre cas, le gestionnaire de signaux n'effectuait aucun travail. Si le gestion- 
naire consomme vraiment du temps processeur, et si la precision du delai est critique, on se 
reportera au principe evoque avec si eep( ), en recadrant la duree restante regulierement grace 
a la fonction time( ). 

Dans les noyaux Linux 2.2 et 2.4, les attentes de faible duree (inferieures a 2 ms) avec nano- 
sl eep( ) pour les processus ordonnances en temps-reel etaient realisees en utilisant une boucle 
active. La precision etait tres bonne mais l'ensemble du systeme etait gele durant l'attente. 
Ce mecanisme a ete abandonne depuis le noyau 2.6. 

Sommeil utilisant les temporisations de precision 

Nous avons vu dans les chapitres precedents le fonctionnement de l'appel-systeme alarmO, 
qui declenche un signal SIGALRM au bout du nombre de secondes programmees. II existe en 
fait trois temporisations qui fonctionnent sur un principe similaire, mais avec une plus grande 
precision (tout en etant toujours limitees a la resolution de l'horloge interne a 1/HZ seconde, 
soit 1 ms sur architecture PC). 

De plus, ces temporisations peuvent etre configurees pour redemarrer automatiquement au bout 
du delai prevu. Les trois temporisations sont programmees par l'appel-systeme seti timer ( ). 
On peut egalement consulter la programmation en cours grace a l'appel getitimerO. 

Le prototype de setitimerO est declare ainsi dans <sys/time.h> : 

int setitimer (int laquelle, const struct itimerval * valeur, 
struct itimerval * ancienne); 

Le premier argument permet de choisir quelle temporisation est utilisee parmi les trois 
constantes symboliques suivantes : 





Nom 


Signification 


I T I M E R_ 


.REAL 


Le decompte de la temporisation a lieu en temps « reel », et lorsque le compteur arrive a 
zero, le signal SIGALRM est envoye au processus. 


I T I M E R_ 


.VIRTUAL 


La temporisation ne decroit que lorsque le processus s'execute en mode utilisateur. Un 
signal SIGVTALRM lui est envoye a la fin du decompte. 


I T I M E R_ 


.PROF 


Le decompte a lieu quand le processus s'execute en mode utilisateur, mais egalement 
pendant qu'il s'execute en mode noyau, durant les appels-systeme. Au bout du delai 
programme, le signal SIGPROF est emis. 
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L'utilisation de la temporisation ITIMER_REAL est la plus courante. Elle s'apparente globa- 
lement au meme genre d'utilisation que la fonction alarmO, mais offre une plus grande 
precision et un redemarrage automatique en fin de comptage. 

ITIMER_VI RTUAL s'utilise surtout conjointement a ITIMEFLPROF, car ces temporisations permet- 
tent, par une simple soustraction, d'obtenir des statistiques sur le temps d'execution passe par 
le processus en mode utilisateur et en mode noyau. 

La temporisation I T I M E R_P RO F permet de rendre compte du deroulement du processus inde- 
pendamment des mecanismes d'ordonnancement, et done d' avoir une indication quantitative 
de la duree d'une tache quelle que soit la charge systeme. On peut utiliser cette technique 
pour comparer par exemple les durees de plusieurs algorithmes de calcul. 

Pour lire Fetat de la programmation en cours, on utilise getitimer( ) : 

int getitimer (int laquelle, struct itimerval * valeur); 

La structure itimerval servant a stocker les donnees concernant un timer est definie dans 
<sys/time.h> avec les deux membres suivants : 



Type Norn 


Signification 


struct timeval it_interval 


Valeur a reprogrammer lors de I'expiration du timer 


struct timeval it_value 


Valeur decroissante actuelle 


La structure timeval que nous avons deja rencontree dans la presentation de wait3() est 
utilisee pour enregistrer les durees, avec les membres suivants : 


Type Norn 


Signification 


time_t tv_sec 


Nombre de secondes 


time_t tv_usec 


Nombre de microsecondes 



La valeur du membre it_value est decrementee regulierement suivant les caracteristiques de 
la temporisation. Lorsque cette valeur atteint zero, le signal correspondant est envoye. Puis, si 
la valeur du membre it_interval est non nulle, elle est copiee dans le membre i t_val ue, et la 
temporisation repart. 

La bibliotheque GlibC offre quelques fonctions d' assistance pour manipuler les structures 
timeval. Comme le champ tv_usec d'une telle structure doit toujours etre compris entre 0 et 
999.999, il n'est pas facile d'ajouter ou de soustraire ces donnees. Les fonctions d'aide sont 
les suivantes : 

void timerclear (struct timeval * temporisation); 

qui met a zero les deux champs de la structure transmise. 

void timeradd (const struct timeval * duree_l, 
const struct timeval * duree_2, 
struct timeval * duree_resultat) ; 

additionne les deux structures (en s'assurant que les membres tv_usec ne depassent pas 
999.999) et remplit les champs de la structure resultat, sur laquelle on passe un pointeur en 



Sommeil des processus et controle des ressources 

Chapitre 9 



dernier argument. Une structure utilisee en premier ou second argument peut aussi servir pour 
recuperer le resultat, la bibliotheque C realisant correctement la copie des donnees. 

void timersub (const struct timeval * duree_l, 
const struct timeval * duree_2, 
struct timeval * duree_resultat) ; 

soustrait la deuxieme structure de la premiere (en s'assurant que les membres tv_usec ne 
deviennent pas negatifs) et remplit les champs de la structure resultat. 

int timerisset (const struct timeval * temporisation) ; 

est vraie si au moins l'un des deux membres de la structure est non nul. 



Attention 

Nous avons presente ici des prototypes de fonctions, mais en realite elles sont toutes les quatre implemen- 
tees sous forme de macros, qui evaluent plusieurs fois leurs arguments. II faut done prendre les precautions 
adequates pour eviter les effets de bord. 



Le premier exemple que nous allons presenter avec setitimer( ) va servir a implementer un 
sommeil de duree precise, meme lorsque le processus recoit de nombreuses interruptions 
parallelement a son sommeil. Pour cela, nous utiliserons le timer ITIMER_REAL. Nous allons 
creer une fonction sommei l_preci s( ), prenant en argument le nombre de secondes, suivi du 
nombre de microsecondes de sommeil voulu. La routine sauvegarde tous les anciens parame- 
tres, qu'elle modifie pour les retablir en sortant. Elle renvoie 0 si elle reussit, ou -1 sinon. On 
utilise la methode de blocage des signaux employant sigsuspend( ) , que nous avons etudie 
dans le chapitre precedent. 

La routine sommei l_preci s ( ) creee ici est appelee depuis les deux processus pere et fils que 
nous declenchons dans main( ). Le fils utilise un appel sur une longue duree (60 s), et le pere 
une multitude d'appels de courte duree (20 ms). Le processus pere envoie un signal SIGUSR1 a 
son fils entre chaque petit sommeil. 

Les deux processus invoquent la commande date au debut et a la fin de leur execution pour 
afficher l'heure. 

exemple_setitimer_1.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <signal .h> 

#include <errno.h> 

#include <sys/time.h> 

#include <sys/wait.h> 

static int temporisation_ecoulee; 

void 

gestionnai re_sigal rm (int inutile) 
{ 

temporisation_ecoulee = 1; 

} 
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int 

sommeil_precis (long nb_secondes , long nb_microsecondes) 
{ 

struct sigaction action; 

struct sigaction ancienne_action; 

sigset_t masque_sigal rm; 

sigset_t ancien_masque; 

int sigal rm_dans_ancien_masque = 0; 

struct itimerval ancien_timer; 

struct itimerval nouveau_timer; 

int retour = 0; 

/* Preparation du timer */ 
timerclear(& (nouveau_timer . it_interval ) ) ; 
nouveau_timer.it_value.tv_sec = nb_secondes; 
nouveau_timer.it_value.tv_usec = nb_microsecondes; 

/* Installation du gestionnaire d'alarme */ 
action. sa_handler = gestionnaire_sigalrm; 
sigemptyset(& (action. sa_mask) ) ; 
action.sa_flags = SA_RESTART; 

if (sigaction(SIGALRM, & action, & ancienne_action) ! = 0) 
return -1; 

/* Blocage de SIGALRM avec memorisation du masque en cours */ 
sigemptyset(& masque_sigal rm) ; 
sigaddset(& masque_sigal rm, SIGALRM); 

if (sigprocmask(SIG_BLOCK, & masque_sigal rm, & ancienjnasque) != 0) { 
retour = -1; 

goto reins tal 1 ation_ancien_gestionnai re; 

} 

if (sigismember(& ancien_masque, SIGALRM)) { 
sigal rm_dans_ancien_masque = 1; 
sigdelset(& ancienjnasque, SIGALRM); 

} 

/* Initialisation de la variable globale */ 
temporisation_ecoulee = 0; 

/* Sauvegarde de l'ancien timer */ 
if (getitimer(ITIMER_REAL, & ancien_timer) != 0) { 
retour = -1; 

goto resti tuti on_anci en_masque ; 

} 

/* Decl enchement du nouveau timer */ 

if (setitimer(ITIMER_REAL, & nouveau_timer, NULL) != 0) { 
retour = -1; 

goto resti tuti on_ancien_timer; 

} 

/* Boucle d'attente de la fin du sommeil */ 
while (! temporisation_ecoulee) { 

if ( (sigsuspend(& ancien_masque) != 0) && 
(errno != EINTR) ) { 
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retour = -1; 
break; 

} 

} 

resti tution_ancien_timer: 

if (setitimer(ITIMER_REAL, & ancien_timer, NULL) != 0) 
retour = -1; 
restitution_ancien_masque : 

if (sigal rm_dans_ancien_masque) ( 

sigaddset(& ancienjasque, SIGALRM); 

} 

if (sigprocmask(SIG_SETMASK, & ancienjasque, NULL) != 0) 

retour = -1; 
rei nstal 1 ati on_anci en_gesti onnai re : 

if (sigactiontSIGALRM, & ancienne_action, NULL) ! = 0) 

retour = -1; 

return retour; 

} 

void 

gestionnai re_sigusrl (int inutile) 

{ 

} 

int 
main (void) 

{ 

pid_t pid; 
struct sigaction action; 
int i; 

if ((pid = forkO) < 0) { 

fprintf (stderr, "Erreur dans fork \n"); 
exi t( EXIT_FAI LURE) ; 

} 

action.sa_handler = gesti onnai re_sigusrl; 
sigemptyset(& (action. sa_mask) ) ; 
action.sa_flags = SA_RESTART; 

if (sigactiontSIGUSRl, & action, NULL) != 0) { 
fprintf (stderr, "Erreur dans sigaction \n"); 
exi t(EXIT_FAI LURE) ; 

} 

if (pid == 0) { 

systemC'date +\"Fils : %H:%M:XS\"") ; 
if (sommeil_precis(60, 0) != 0) { 

fprintf (stderr, "Erreur dans sommeil_precis \n"); 

exit(EXIT_ FAILURE); 

} 

systemC'date +\"Fils : %H:3!M:*S\"") ; 
} else { 
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sommeil_precis(2, 0); 

systemCdate +\"Pere : %H:%V\:%SV") ; 

for (i =0; i < 3000; i ++) { 

sommeil_precis(0, 20000); /* 1/50 de seconde */ 

kilKpid, SIGUSR1); 

} 

systemCdate +\"Pere : %H:%H:%SV") ; 
waitpid(pid, NULL, 0); 

} 

return EXIT_SUCCESS; 

} 

Nous voyons que la precision du sommeil est bien conservee, tant sur une longue periode que 
sur un court intervalle de sommeil : 

$ ./exemple_setitimer_l 

Fils : 17:50:34 

Pere : 17:50:36 

Fils : 17:51:34 

Pere : 17:51:36 

$ 

Les temporisations n'expirent jamais avant la fin du delai programme, mais plutot legerement 
apres, avec un retard constant dependant de l'horloge interne du systeme. Si on desire faire 
des mesures critiques, il est possible de calibrer ce leger retard. 

Avec la temporisation ITIMEFLREAL, lorsque le signal SIGALRM est emis, le processus n'est pas 
necessairement actif (contrairement aux deux autres temporisations). II peut done s'ecouler 
un retard avant F activation du processus et la delivrance du signal. Avec la temporisation 
ITIMER_PR0F, le processus peut se trouver au sein d'un appel-systeme, et un retard sera egale- 
ment possible avant l'appel du gestionnaire de signaux. 

Notre second exemple va utiliser conjointement les deux timers ITIMER_VI RTUAL et I T I M E R_ 
PROF pour mesurer les durees passees dans les modes utilisateur et noyau d'une routine qui 
fait une serie de boucles consommant du temps processeur, suivie d'une serie de copies d'un 
fichier vers le peripherique /dev/nul 1 pour executer de nombreux appels-systeme. 

Le gestionnaire de signaux commun aux deux temporisations departage les signaux, puis 
incremente le compteur correspondant. Les temporisations sont reglees pour envoyer un 
signal tous les centiemes de seconde. Une routine d'affichage des donnees est installee par 
atexit( ) afin d'etre invoquee en sortie du programme. 

exemple_setitimer_2.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <signal .h> 
#include <sys/time.h> 
#include <sys/wait.h> 

unsigned long int mode_utilisateur; 
unsigned long int mode_utilisateur_et_noyau; 
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void gestionnaire_signaux 
void fin_du_suivi 
void action_a_mesurer 

i nt 
main (void) 

{ 

struct sigaction action; 
struct itimerval timer; 

/* Preparation du timer */ 
timer. it_val ue.tv_sec = 0; 
timer. it_value.tv_usec = 10000; /* 1/100 s. */ 
timer. it_interval .tv_sec = 0; 
timer. it_interval .tv_usec = 10000; /* 1/100 s. */ 

/* Installation du gestionnaire de signaux */ 
action. sa_handler = gestionnaire_signaux; 
sigemptyset(& (action. sa_mask)) ; 
action.sa_flags = SA_RESTART; 
if ((sigaction(SIGVTALRM, & action, NULL) != 0) 
|| (sigaction(SIGPR0F, & action, NULL) != 0)) { 
fprintf (stderr, "Erreur dans sigaction \n"); 
return EX IT_FAI LURE ; 

} 

/* Decl enchement des nouveaux timers */ 
if ((setitimer(ITIMER_VIRTUAL, & timer, NULL) != 0) 
|| (setitimer(ITIMER_PR0F, & timer, NULL) != 0)) { 
fprintf (stderr, "Erreur dans setitimer \n"); 
return EX IT_FAI LURE ; 

} 

/* Installation de la routine de sortie du programme */ 
if (atexit(fin_du_suivi ) != 0) { 

fprintf (stderr, "Erreur dans atexit \n"); 

return EX IT_FAI LURE ; 

} 

/* Appel de la routine de travail effectif du processus */ 
action_a_mesurer( ) ; 
return EXIT_SUCCESS; 



void 

gestionnai re_signaux (int numero) 

{ 

switch (numero) ( 
case SIGVTALRM : 

mode_utilisateur ++; 

break; 
case SIGPR0F : 

mode_utilisateur_et_noyau ++; 

break; 



(int numero) ; 
(void) ; 
(void) ; 
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void 

fin_du_suivi (void) 
{ 

sigset_t masque; 

/* Blocage des signaux pour eviter une modification */ 
/* des compteurs en cours de lecture. */ 
sigemptyset(& masque); 
sigaddset(& masque, SIGVTALRM); 
sigaddset(& masque, SIGPROF); 
sigprocmask(SIG_BLOCK, & masque, NULL); 

/* Comme on quitte a present le programme, on ne 

* restaure pas 1'ancien comportement des timers, 

* mais il faudrait le faire dans une routine de 

* bibl iotheque. 
*/ 

fprintf (stdout, "Temps passe en mode utilisateur ; %1 d/100 s \n", 

mode_utilisateur); 
fprintf (stdout, "Temps passe en mode noyau : £ld/100 s \n", 

mode_utilisateur_et_noyau - mode_uti 1 isateur) ; 

} 

void 

action_a_mesurer (void) 
{ 

int i , j ; 

FILE * fpl, * fp2; 
double x; 

x = 0.0; 

for (i = 0; i < 20000; i ++) 

for (j = 0; j < 20000; j ++) 
x += i * j; 
for (i = 0; i < 5000; i ++) { 

if ((fpl = fopen ( "exempl e_seti timer_2" , "r")) != NULL) { 
if ((fp2 = fopen("/dev/null", "w")) != NULL) { 
while (fread(& j, sizeof (int), 1, fpl) == 1) 

fwrite(& j, sizeof (int), 1, fp2); 
fclose(fp2) ; 

} 

fclose(fpl) ; 

} 

} 

} 

L' execution affiche les resultats suivants : 

$ ./exemple_setitimer_2 

Temps passe en mode utilisateur : 629/100 s 
Temps passe en mode noyau : 14/100 s 
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$ ./exemple_setitimer_2 

Temps passe en mode utilisateur : 631/100 s 

Temps passe en mode noyau : 13/100 s 

$ ./exemple_setitimer_2 

Temps passe en mode utilisateur : 620/100 s 

Temps passe en mode noyau : 13/100 s 

$ 

Nous voyons les limites du suivi d' execution sur un systeme multitache, meme si les ordres 
de grandeur restent bien constants. Nous copions a present ce programme dans exemple_ 
seti timer_3. c en ne conservant plus que la routine de travail effectif, ce qui nous donne cette 
fonction mai n( ) : 

int 
main (void) 

{ 

action_a_mesurer( ) ; 
return EXIT_SUCCESS; 

} 

Nous pouvons alors utiliser la fonction « times » de bash 2, qui permet de mesurer les temps 
cumules d' execution en mode noyau et en mode utilisateur du shell et des processus qu'il a 
lances. 

$ sh -c "./exemple_setitimer_3 ; times" 

OmO.OOOs 0m0.002s 
0m6.545s 0m0.169s 

$ sh -c "./exemple_setitimer_3 : times" 

OmO.OOOs 0m0.002s 
0m6.563s 0m0.134s 

$ sh -c "./exemple_setitimer_3 : times" 

OmO.OOOs OmO. 0002s 
0m6.562s OmO. 149s 
$ 

Nous voyons que les resultats sont tout a fait comparables, meme s'ils presentent egalement 
une variabilite due a l'ordonnancement multitache. 



Timers temps-reel 

Depuis le noyau 2.6, Linux integre un ensemble d'appels systeme permettant de realiser des 
taches periodiques. Le principe est simple : on programme un timer avec un delai initial et 
une periode de repetition donnes. Au declenchement du timer, le noyau delivrera un signal au 
processus et rearmera la temporisation. La creation et la destruction d'un timer se font avec 
les routines suivantes : 

int timer_create (clockid_t clock, struct sigevent * event, 

timer_t * timer) ; 
int timer_delete (timer_t timer); 

Le premier argument de timer_create( ), de type cl ockid_t, decrit une horloge fournie par le 
systeme sur laquelle le timer doit s'appuyer. Chaque implementation peut proposer ses 
propres horloges, et eventuellement proposer la definition d'horloges par l'application. 
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Toutefois certaines ont une signification standard : 

• CLOCK_REALTIME : cette horloge represente l'ecoulement effectif du temps tel qu'il est percu 
par le systeme. La valeur de l'horloge peut etre modifiee (par exemple avec la commande 
date depuis le shell). 

• CL0CK_M0N0T0NIC : contrairement a la precedente, la valeur de l'horloge monotone est stric- 
tement croissante. La modification de l'heure systeme n'influe pas sur elle. 

• CLOCK_PROCESS_CPUTIME_ID : une horloge qui demarre en meme temps que le processus. 
Elle represente la duree complete d' execution du processus, meme lorsqu'il est endormi. 

• CLOCK_THREAD_CPUTIME_ID : cette horloge est semblable a la precedente mais demarre 
lorsque le thread courant debute. Elle peut done etre decalee par rapport a la precedente. 

Le second argument est une structure decrivant la maniere dont le noyau doit notifier le pro- 
cessus de l'expiration du timer. Cette structure sera etudiee plus en detail dans le chapitre 30, 
en examinant les fonctions aio_read( ) et aio_write( ). Ici nous nous limiterons a son champ 
sigev_notify qui doit contenir la constante SIGEV_SIGNAL pour que le noyau sache qu'il doit 
envoyer un signal au processus. En outre, le champ si gev_si gno contient le numero du signal 
a employer. 

Le troisieme argument enfin est un pointeur sur un objet de type timer_t qui contiendra au 
retour l'identifiant du timer cree. 

Pour amorcer le timer, il faut utiliser la fonction suivante : 

int timer_settime (timer_t timer, int options, 
const struct itimerspec * spec, 
struct itimerspec * precedent); 

Le premier argument est l'identifiant du timer obtenu precedemment, si le second argument 
est nul, les valeurs indiquees dans la structure itimerspec du troisieme argument sont rela- 
tives a l'heure actuelle. Si ce second argument contient la valeur TIMER_ABSTIME, les valeurs 
sont des heures absolues. 

La structure itimerspec est tres proche de la structure itimerval que nous avons vue plus 
haut. Elle contient deux champs it_value et it_interval de type struct timespec (deux 
champs tv_sec et tv_nsec) decrivant (en secondes et nanosecondes) le delai avant expiration 
du timer et la periode de repetition. 

Ces fonctions de temporisation etant issues de la norme Posix.lb (temps-reel), il faut ajouter 
l'option -1 rt (real time library) lors de l'edition des liens. Ceci est present dans le fichier 
Ma kef i 1 e fourni avec les sources des programmes du livre. 

Dans l'exemple suivant nous allons programmer deux timers : le premier s'execute avec une 
frequence fournie par l'utilisateur sur la ligne de commande. A chaque expiration nous incre- 
mentons un compteur global. Le second timer fonctionne avec une periode d'une seconde. II 
affiche la valeur du compteur (qui correspond done a la frequence reelle de 1' autre timer) et le 
reinitialise. 

exemplejimer.c : 

#include <signal .h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <time.h> 
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#include <unistd.h> 
volatile int compteur = 0; 
void 

gestionnai re_usrl(int numero) 

{ 

compteur ++; 

} 

void 

gestionnaire_usr2(int numero) 
{ 

fprintf (stderr, "M\n", compteur); 
compteur = 0; 

} 

int 

maintint argc, char * argv[]) 
{ 

long int frequence; 

timer_t timerl, timer2; 
struct sigevent event; 
struct itimerspec itimer; 

struct sigaction action; 

if ((argc != 2) 
|| (sscanf (argv[l] , "£ld", & frequence) != 1) 
|| (frequence < 2) | | (frequence > 1000000000)) { 

fprintf (stderr, "usage: %s f requence\n" , argv[0]); 

exit(EXIT_FAILURE); 

} 

action.sa_flags = 0; 
sigfillset(& action. sa_mask) ; 

action. sa_handler = gestionnaire_usrl; 
sigactiontSIGUSRl, & action, NULL); 

action. sa_handler = gestionnaire_usr2; 
sigaction(SIGUSR2, & action, NULL); 

event. si gev_notify = SIGEV_SIGNAL; 
event. sigev_signo = SIGUSR1; 

if (timer_create(CL0CK_REALTIME, & event, & timerl) != 0) { 
perrort "timer_create" ) ; 
exi t( EXIT_FAI LURE) ; 

} 
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event. si gev_notify = SIGEV_SIGNAL; 
event. sigev_signo = SIGUSR2; 



if (timer_create(CLOCK_REALTIME, & event, & timer2) != 0) { 
perrort "timer_create" ) ; 
exit(EXIT_FAILURE); 

} 

itimer. it_value.tv_sec = 0; 

itimer. it_value.tv_nsec = 1000000000/frequence; 

itimer. it_interval .tv_sec = 0; 

itimer. it_interval .tv_nsec = 1000000000/frequence; 

if (timer_settime(timerl, 0, & itimer, NULL) != 0) { 
perror("timer_settime" ) ; 
exit(EXIT_FAILURE); 

} 



itimer. it_value.tv_sec = 1; 
itimer. it_value.tv_nsec = 0; 
itimer. it_interval .tv_sec = 1; 
itimer. it_interval .tv_nsec = 0; 



if (timer_settime(timer2, 0, & itimer, NULL) != 0) { 
perror("timer_settime" ) ; 
exit(EXIT_FAILURE); 

} 



while (1) 

pause( ) ; 
return EXIT_SUCCESS; 

} 

Lors de son execution, le programme montre les limites d'un timer gere par l'ordonnanceur. 
Pour de faibles valeurs, le comptage est assez bon, mais tres vite la limitation a la milli- 
seconde superieure est contraignante : 

$ ./exemple_timer 10 

9 

10 
10 
10 

(Ctrl-C) 
$ ./exemple_timer 20 

19 
20 
19 
20 

(Ctrl-C) 
$ ./exemple_timer 50 
47 
48 
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48 
47 

(Ctrl-C) 
$ ./exemple_timer 100 

91 
91 
91 

(Ctrl-C) 
$ ./exemple_timer 200 
166 
167 

(Ctrl-C) 
$ ./exemple_timer 500 
333 
334 

(Ctrl-C) 
$ ./exemple_timer 501 
501 
500 

(Ctrl-C) 
$ ./exemple_timer 1000 
500 
501 

(Ctrl-C) 
$ ./exemple_timer 1001 
1001 
1001 

(Ctrl-C) 
$ ./exemple_timer 2000 
1001 
1001 

(Ctrl-C) 
$ ./exemple_timer 10000 
1001 
1001 

(Ctrl-C) 

$ 

Le noyau Linux standard n'est pas fait pour realiser des taches temps-reel de haute precision. 
Si Ton a besoin d'obtenir des temporisations de duree inferieure a quelques millisecondes, il 
faudra utiliser une autre solution. 

Une alternative existe : le projet RTAI (heberge par l'universite polytechnique de Milan sur le 
site : http://www.aero.polimi.it/~rtai) fait fonctionner le noyau Linux comme tache de fond 
d'un micro-noyau minimal offrant des fonctionnalites temps-reel strictes. II est possible de 
programmer des taches pour le noyau minimal (par exemple des acquisitions de donnees avec 
une periodicite tres precise) qui communiqueront avec 1' application principale tournant dans 
Fespace du noyau Linux. 

D'autres implementations du meme type existent, mais RTAI est l'option la plus avancee 
developpee sous licence libre. 
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Suivre I'execution d'un processus 

II existe plusieurs fonctions permettant de suivre I'execution d'un processus, a la maniere des 
routines que nous avons developpees precedemment. La plus simple d'entre elles est la fonc- 
tion clockO, declaree dans <time.h> ainsi : 

clock_t clock (void) ; 

Le type clock_t represente un temps processeur ecoule sous forme d'impulsions d'horloge 
theoriques. Nous precisons qu'il s'agit d'impulsions theoriques car il y a une difference 
d'ordre de grandeur importante entre ces quantites et la veritable horloge systeme utilisee par 
l'ordonnanceur. A cause d'une difference entre les standards Ansi C et Posix, cette valeur n'a 
plus aucune signification effective. Pour obtenir une duree en secondes, il faut diviser la 
valeur cl ock_t par la constante CLOCKS_PER_SEC. Cette constante vaut 1 million sur l'essentiel 
des systemes Unix derivant de Systeme V, ainsi que sous Linux. On imagine assez bien que le 
sequencement des taches est loin d' avoir effectivement lieu toutes les microsecondes... 

On ne sait pas avec quelle valeur la fonction cl ock( ) demarre. II s'agit parfois de zero, mais 
ce n'est pas obligatoire. Aussi est-il necessaire de memoriser la valeur initiale et de la sous- 
traire pour connaitre la duree ecoulee. 

Sous Linux, clock_t est un entier long, mais ce n'est pas toujours le cas sur d'autres 
systemes. II importe done de forcer le passage en virgule flottante pour pouvoir effectuer 
l'affichage. Notre programme d'exemple va mesurer le temps processeur ecoule tant en mode 
utilisateur qu'en mode noyau, dans la routine que nous avons deja utilisee dans les exemples 
precedents. 

Le programme exempl e_cl ock. c contient done la fonction mainO suivante, en plus de la 
routine acti on_a_mesurer( ). 

exemple_clock.c : 

int 
main (void) 
{ 

clock_t debut_programme; 
double duree_ecoulee; 

debut_programme = clockO; 

action_a_mesurer( ) ; 

duree_ecoul ee = clockO - debut_programme; 
duree_ecoul ee = duree_ecoulee / CLOCKS_PER_SEC; 
fprintf (stdout, "Duree = %f \n", duree_ecoul ee) ; 
return EXIT_SUCCESS; 

} 

Les resultats sont les suivants : 

$ . /exempl e_cl ock 

Duree = 6.800000 
$ . /exempl e_cl ock 
Duree = 6.780000 
$ 
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Comme il fallait s'y attendre, il s'agit de la somme des temps obtenus avec nos programmes 
precedents, avec - comme toujours - une legere variation en fonction de la charge systeme. 

Sous Linux, cl ock_t est equivalent a un 1 ong i nt. II y a done un risque de debordement de la 
valeur maximale au bout de L0NG_MAX impulsions theoriques. L0NG_MAX est une constante 
symbolique definie dans <1 imi ts . h>. Sur un PC, L0NG_MAX vaut 2.147.483.647, et CLOCKS_PER_ 
SEC vaut 1.000.000. Cela donne done une duree avant le depassement de 2 147 secondes, soit 
35 minutes. 

Rappelons qu'il s'agit la de temps processeur effectif, et qu'il est assez rare qu'un programme 
cumule autant de temps d' execution. Mais cela peut arriver, notamment avec des programmes 
de calcul ou de traitement d'image. Si on desire suivre les durees d'execution de tels 
programmes (particulierement pour comparer des algorithmes), il faut disposer d'un meca- 
nisme permettant d'obtenir des mesures plus longues. 

L'appel-systeme times ( ) fournit ces informations. II est declare ainsi dans <sys /times . h> : 

clock_t times (struct tins * mesure); 

La valeur renvoyee par cet appel-systeme est le nombre de jiffies, e'est-a-dire le nombre de 
cycles d'horloge executes depuis le demarrage du systeme, ou (clock_t)-l en cas d'echec. 
II s'agit cette fois de la veritable horloge de l'ordonnanceur, qui a une periode de 1/1000 s 
sur PC. On peut utiliser cette valeur renvoyee, un peu a la maniere de celle qui est fournie par 
la fonction clockO, mais en utilisant une autre constante de conversion, celle qui decrit le 
nombre d'impulsions d'horloge par seconde : CLK_TCK, definie dans <time.h>. 

Notre premier exemple ne s'occupera pas de 1' argument de la fonction ti mes ( ), en passant un 
pointeur NULL, afin de se soucier uniquement de la valeur de retour. Nous calquons notre 
programme sur le precedent, avec la fonction mainO suivante : 

exemple_times_1.c : 

int 
main (void) 

{ 

clock_t debut_programme; 
double duree_ecoul ee; 

debut_programme = times (NULL); 

fprintf (stdout, "Jiffies au debut %ld \n", debut_programme) ; 
action_a_mesurer( ) ; 

fprintf (stdout, "Jiffies en fin %ld \n", times (NULL)); 
duree_ecoul ee = times(NULL) - debut_programme; 
duree_ecoul ee = duree_ecoul ee / CLK_TCK; 
fprintf (stdout, "Duree = %f \n", duree_ecoulee) ; 
return EXIT_SUCCESS; 

} 

L execution est la suivante : 

$ ./exemple_times_l 

Jiffies au debut 444792126 
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Jiffies en fin 444792838 
Duree = 7.120000 
$ 

Cette fois-ci, la duree est celle de F execution totale du programme et non le temps processeur 
consomme (il y a peu d'ecart car notre machine est actuellement faiblement chargee). 

Voici a present le detail de la structure tms, qu'on passe en argument de times ( ) afin qu'elle 
soit remplie. La definition se trouve dans <sys/times . h>. 



Type 




Norn 


Signification 


cl ock_t 


tms_ 


_utime 


Temps processeur passe en mode utilisateur 


cl ock_t 


tms_ 


_stime 


Temps processeur passe en mode noyau 


clock_t 


tms_ 


_cutime 


Temps processeur passe en mode utilisateur par les processus tils termines du 
programme appelant 


cl ock_t 


tms_ 


_cstime 


Temps processeur passe en mode noyau par les processus fils termines du 
programme appelant 



Les deux derniers membres contiennent les temps utilisateur et noyau cumules de tous les 
processus fils termines au moment de l'appel. Nous allons utiliser ces membres apres avoir 
invoque une commande passee en argument au programme. Cela permet d' avoir une fonc- 
tionnalite du meme style que la commande times integree au shell bash. 

exemple_times_2.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <time.h> 
#include <sys/times.h> 

int 

main (int argc, char * argv[]) 
{ 

struct tms mesure; 
double duree_ecoul ee; 

if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s <commande> \n", argv [0]); 
exit(EXIT_FAILURE); 

} 

system(argv[l] ) ; 
times(& mesure) ; 

duree_ecoul ee = mesure. tms_cutime; 
duree_ecoul ee = duree_ecoulee / CLK_TCK; 

fprintf (stdout, "Temps CPU mode utilisateur = %f \n", duree_ecoul ee) ; 
duree_ecoul ee = mesure. tms_cstime; 
duree_ecoul ee = duree_ecoulee / CLK_TCK; 

fprintf (stdout, "Temps CPU en mode noyau = %f \n", duree_ecoul ee) ; 
return EXIT_SUCCESS; 

} 
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L' execution, en reprenant toujours notre meme routine de test, donne les resultats suivants : 

$ ./exemple_times_2 ./exemple_setitimer_3 

Temps CPU mode utilisateur = 6.560000 
Temps CPU en mode noyau = 0.130000 
$ ./exemple_times_2 ./exemple_setitimer_3 
Temps CPU mode utilisateur = 6.550000 
Temps CPU en mode noyau = 0.150000 
$ ./exemple_times_2 ./exemple_setitimer_3 
Temps CPU mode utilisateur = 6.540000 
Temps CPU en mode noyau = 0.150000 
$ 

Les statistiques obtenues sont compatibles avec les donnees que nous avons deja observees. 

Obtenir des statistiques sur un processus 

II est parfois utile d' obtenir des informations sur les performances d'un programme donne. 
On peut ainsi, dans certains cas, optimiser les algorithmes ou reetudier certains goulets 
d'etranglement oil le programme est ralenti. La fonction getrusageO permet d'obtenir les 
statistiques concernant le processus appelant ou l'ensemble de ses fils qui se sont termines. 
Dans ce dernier cas, les valeurs sont cumulees sur la totalite des processus concernes. 

Le prototype de getrusageO est declare dans <sys/resource. h> ainsi : 
| int getrusage (int lesquelles, struct rusage * statistiques); 

Le premier argument de cette fonction indique quelles statistiques nous interessent. II peut 
s'agir de l'une des constantes symboliques suivantes : 



Norn 


Signification 




RUSAGE_SELF 


Obtenir les informations concernant le processus appelant 




RUSAGE_CHI LDREN 


Obtenir les statistiques sur les processus fils termines 





Le second argument est la structure rusage, que nous avons deja rencontree dans le para- 
graphe concernant wait30. Cette derniere estremplie lors de l'appel. La fonction renvoie 0 si 
elle reussit, et -1 si elle echoue. En fait, sous Linux, comme avec wai t3() et wai t4( ) , l'appel- 
systeme getrusage( ) ne remplit qu'un petit nombre de champs de la structure rusage. 



Type 




Nom 


Signification 


struct timeval 


ru_ 


_utime 


Temps passe par le processus en mode utilisateur. 


struct timeval 


ru 


_stime 


Temps passe par le processus en mode noyau. 


long 


ru_ 


jm'nflt 


Nombre de fautes de pages mineures (n'ayant pas necessite de recharge- 
ment depuis le disque). 


long 


ru_ 


jnajflt 


Nombre de fautes de pages majeures (ayant necessite un rechargement 
des donnees depuis le disque). 


long 


ru_ 


_nswap 


Nombre de fois ou le processus a ete entierement swappe. 
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Les autres champs sont mis a zero lors de l'appel. De cette facon, une application desirant 
tirer parti de leur contenu lorsqu'ils seront vraiment remplis par une nouvelle version du 
noyau peut verifier si leur valeur est non nulle et les utiliser alors. 

Voici un exemple d' utilisation oil, comme dans le programme precedent, nous lancons la 
commande passee en argument grace a la fonction system( ). Si aucun argument n'est fourni, 
le processus affiche les statistiques le concernant. 

exemple_rusage.c : 

//include <stdio.h> 
//include <stdlib.h> 
//include <unistd.h> 
//include <sys/resource.h> 

int 

main (int argc, char * argv[]) 
{ 

int lesquelles; 

struct rusage statistiques; 

if (argc == 1) { 

lesquelles = RUSAGE_SELF; 
} else { 

system (argv[l]); 

lesquelles = RUSAGE_CHI LDREN ; 

} 

if (getrusagedesquelles, & statistiques) != 0) { 

fprintf (stderr, "Impossible d'obtenir les statistiques \n"); 
exit(EXIT_FAILURE); 

} 

if (getrusagedesquelles, & statistiques) != 0) { 

fprintf (stderr, "Impossible d'obtenir les statistiques \n"); 
exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Temps en mode utilisateur %~\d s. et %ld ms \n", 

statistiques. ru_utime.tv_sec, 

statistiques. ru_utime.tv_usec / 1000); 
fprintf (stdout, "Temps en mode noyau £ld s. et %ld ms \n", 

statistiques. ru_stime.tv_sec, 

statistiques. ru_stime.tv_usec / 1000); 
fprintf (stdout, "\n"); 

fprintf (stdout, "Nombre de fautes de pages mineures : %~\d \n", 

stati stiques . ru_minf 1 1) ; 
fprintf (stdout, "Nombre de fautes de pages majeures : £ld \n", 

statistiques. ru_majfl t) ; 
fprintf (stdout, "Nombre de swaps du processus : %ld \n", 

statistiques. ru_nswap) ; 
return EXIT_SUCCESS; 

} 
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On l'execute toujours avec la meme routine de test : 

$ ./exemple_rusage ./exemple_setitimer_3 

Temps en mode utilisateur 6 s. et 549 ms 
Temps en mode noyau 0 s. et 141 ms 

Nombre de fautes de pages mineures : 10374 
Nombre de fautes de pages majeures : 0 
Nombre de swaps du processus : 0 

$ 

Les durees sont coherentes avec les statistiques deja obtenues. Le nombre de fautes de pages 
est beaucoup plus difficile a interpreter. 



Limiter les ressources consommees par un processus 

Les processus disposent d'un certain nombre de limites, supervisees par le noyau. Celles-ci 
se rapportent a des parametres concernant des ressources systeme dont l'utilisation par 
le processus est surveillee etroitement. Certaines limites se justifient principalement dans le 
cas d'un systeme multi-utilisateur, pour eviter de leser les autres personnes connectees. C'est 
le cas par exemple du nombre maximal de processus pour un meme utilisateur, ou de la taille 
maximale d'un fichier. D'autres limites peuvent interesser le programmeur, pour surveiller le 
comportement de son application, comme la limite maximale de la pile ou du temps proces- 
seur consomme. 

Comme la plupart des stations Linux sont reservees a un seul utilisateur, une partie impor- 
tante des limites ne se justifie pas forcement, et les distributions ont un comportement tres 
liberal dans leur configuration par defaut. 

On accede aux ressources d'un processus grace a la fonction getrl imit( ), declaree dans 
<sys/resource.h> ainsi : 

int getrlimit (int ressource, struct rlimit * limite); 

Le premier argument permet de preciser la ressource concernee, et la structure rlimit, trans- 
mise en second argument, est remplie avec la limite demandee. La fonction renvoie 0 si elle 
reussit, et -1 en cas d'echec. 

Chaque limite est composee de deux valeurs : une souple et une stricte. La limite souple peut 
etre augmentee ou diminuee au gre de l'utilisateur, tout en ne depassant jamais la limite 
stricte. Celle-ci peut etre diminuee par l'utilisateur, mais ne peut etre augmentee que par root 
ou un processus ayant la capacite CAP_SYS_RESOURCE. 

Les limites sont transmises aux processus fils et aux programmes lances par un exec( ). II est 
done courant que l'administrateur systeme impose des valeurs aux limites strictes dans les 
fichiers d'initialisation du shell de connexion des utilisateurs. 

II existe une valeur speciale, definie par la constante symbolique RL I M_I N F I N I TY , pour indi- 
quer que le processus n'a pas de limitation pour la ressource concernee. 
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Les differentes ressources sont les suivantes : 



Norn 


oiy nil iGaiion 


R L 1 M I T_ 


.CPU 


Temps processeur consommable par le processus. S'il depasse sa limite souple, il recoit le 
signal SIGXCPU toutes les secondes. S'il I'ignore et atteint sa limite stricte, le noyau le tue par 
SIGKILL. 


RLIMIT. 


.FSIZE 


Taille maximale en octets d'un fichier cree par le processus. Si on essaye de depasser cette 
valeur, un signal SIGXFSZ est envoye au processus si aucun octet n'a ete ecrit. Si ce signal est 
ignore, les ecritures apres la limite se solderont par un echec avec I'erreur EFBIG. 


RLIMIT. 


.DATA 


Taille maximale de la zone de donnees d'un processus. Cette limite est mise en place au 
chargement du programme. 


RLIMIT. 


.STACK 


Taille maximale de la pile. 


RLIMIT. 


.CORE 


Taille maximale d'un eventuel fichier d'image memoire core. Si cette limite est mise a zero, 
aucun fichier core ne sera cree en cas d'arret anormal du processus. 


RLIMIT. 


_RSS 


Taille maximale de I'ensemble des donnees se trouvant simultanement en memoire (cette 
limite n'est pas utilisee par les noyaux 2.2 et 2.6, et son usage sous Linux 2.4 est tres limite). 


RLIMIT. 


.NPROC 


Nombre maximal de processus simultanes pour I'utilisateur. 


RLIMIT. 


.NOFILE 


Nombre maximal de fichiers ouverts simultanement par un utilisateur. 


RLIMIT. 


.MEMLOCK 


Taille maximale de la zone verrouillee en memoire centrale en empechant son transfert dans le 
swap. On etudiera le detail de ce mecanisme avec les fonctions comme ml ock( ) . 



Ces limites sont surtout utiles pour empecher un utilisateur de s'approprier trop de ressources 
au detriment des autres. Elles n'ont pas un grand interet pour le programmeur, a quelques 
exceptions pres : 

• La limite de temps CPU : pour des applications effectuant de lourds calculs ou des logi- 
ciels fonctionnant sans interruption pendant plusieurs mois, il est bon de verifier que la 
limite de temps CPU n'est pas trop restrictive. Sinon, il faudra demander a l'administrateur 
systeme une augmentation de la limite stricte. 

• La limite de taille de fichier : en general, cette limite est suffisamment grande pour les 
applications courantes. Elle peut cependant etre contraignante, par exemple pour un 
systeme d'enregistrement sur une longue duree de donnees provenant d'un reseau. II peut 
alors etre necessaire de scinder un gros fichier en plusieurs petits. Notons que cette limita- 
tion ne fonctionne pas sur tous les systemes de fichiers et que d' autres limites peuvent etre 
imposees, comme le systeme de quotas de disques, ou des limites sur le serveur d'une 
partition montee par NFS. Lorsqu'un processus tente de depasser cette taille, il recoit un 
signal SIGXFSZ si aucun octet n'a pu etre ecrit. 

• La limite de taille des fichiers core : lorsqu'un programme a termine sa phase de debogage 
et qu'il est livre aux utilisateurs, les eventuels fichiers core qui peuvent etre crees lorsqu'il 
s'arrete anormalement ne presentent aucun interet pour I'utilisateur final. lis laissent meme 
une impression de finition negligee s'ils ont tendance a se multiplier dans tous les reper- 
toires ou I'utilisateur se trouve lorsqu'il lance F application. II est done conseille, au debut 
du programme, de mettre a zero cette limite lorsqu'on decide que le code est suffisamment 
stable pour etre distribue aux clients. 
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• Le nombre maximal de processus simultanes : il est conseille de mettre une valeur suffi- 
samment haute (par exemple, 256) dans les fichiers d' initialisation du shell de connexion, 
mais de ne pas laisser la limite infinie. En effet, cela permet de prevenir des erreurs de 
programmation ou on boucle sur un fork( ). Au bout d'un certain temps, celui-ci echouera 
et, de cette maniere, root pourra stopper tous les processus du groupe fautif depuis une 
autre console. 

Pour acceder aux limites, les shells offrent une commande integree, qui nous suffira dans la 
plupart des cas puisque les limites sont transmises aux processus fils, done aux applications 
lancees par le shell. 



Attention 

Le shell n'utilise pas toujours les memes unites que celles manipulees par le noyau. Ainsi la limite FSIZE 
(taille maximale de fichier) est exprimee en kilo-octets par le shell et en octets par le noyau. 



Avec tcsh, la commande est « limit ». Si on l'invoque seule, elle affiche l'etat des limites 
souples actuelles. Avec l'option - h, elle s'occupe des limites strides (hard). 



% limit 




cputime 


unl imited 


filesize 


unl imited 


datasize 


unl imited 


stacksize 


8192 kbytes 


coredumpsize 


1000000 kbytes 


memoryuse 


unl imited 


descriptors 


1024 


memoryl ocked 


unl imited 


maxproc 


256 


openf i 1 es 


1024 


% limit -h 




cputime 


unl imited 


filesize 


unl imited 


datasize 


unl imited 


stacksize 


unl imited 


coredumpsize 


unl imited 


memoryuse 


unl imited 


descriptors 


1024 


memoryl ocked 


unl imited 


maxproc 


256 


openf i 1 es 


1024 



% 



Nous voyons une difference sur les limitations de taille de la pile et des fichiers core, qui 
doivent probablement etre fixees dans un script d' initialisation de tcsh. 

Si on veut modifier une limite, on indique le nom de la ressource, tel qu'il apparait dans la 
liste precedente, suivi de la valeur desiree (en secondes pour le temps CPU, en Ko pour les 
autres limites). Si on ajoute l'option -h, on modifie la limite stricte : 

% limit cputime 240 
% limit coredumpsize 100 
% limit 
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cputime 


4:00 


files ize 


unl imited 


datasize 


unl imited 


stacksize 


8192 kbytes 


coredumpsize 


100 kbytes 


memoryuse 


unl imited 


descriptors 


1024 


memoryl ocked 


unl imited 


maxproc 


256 


openf i 1 es 


1024 



% limit -h coredumpsize 1000 
% limit -h coredumpsize 2000 

limit: coredumpsize: Can't set hard limit 
% limit -h 

cputime unlimited 
filesize unlimited 
datasize unlimited 
stacksize unlimited 
coredumpsize 1000 kbytes 
memoryuse unlimited 
descriptors 1024 
memorylocked unlimited 
maxproc 256 
openfiles 1024 
% limit coredumpsize 4000 
limit: coredumpsize: Can't set limit 
% 

Cet exemple nous montre bien qu'on ne peut que reduire les limites « hard » (la tentative de 
ramener coredumpsize stricte a 2000 echoue). De meme, une limite souple ne peut pas etre 
programmed au-dessus de la limite stricte (c'est pareil pour coredumpsi ze a 4000). 

Sous bash, la commande est ulimit. Elle peut etre suivie de -S (par defaut) ou de -H, pour 
indiquer une limite souple ou stricte, puis d'une lettre s'appliquant au type de ressource 
recherchee, et eventuellement de la nouvelle valeur. Les lettres correspondant aux limites 
sont : 



Option Signification 



a 


Toutes les limites (affichage seulement) 


c 


Taille d'un fichier core 


d 


Taille du segment de donnees d'un processus 


f 


Taille maximale d'un fichier 


m 


Taille maximale des donnees se trouvant simultanement en memoire 


s 


Taille de la pile 


t 


Temps processeur maximal 


n 


Nombre de fichiers ouverts simultanement 


u 


Nombre maximal de processus par utilisateur 


V 


Quantite de memoire virtuelle disponible 
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Voici les memes manipulations que sous tcsh, effectuees cette fois-ci sous bash. 
$ ulimit -a 



core f i 1 6 size (blocks) 


i nnnnnn 

1UUUUUU 


data seg size (kbytes) 


unl i mi ted 


file size (blocks) 


unl i mi ted 


[Max iiiciiiury b i Zc v K.uy Lcb ) 


UN 1 1 III 1 LcU 


stack size (kbytes) 


PI Q9 


Ann ■("lino f coonnHc 1 
LpU L 1 lllc VbcLUMUiW 


UN 1 1 III 1 LcU 


NldX Ubcl piULcbbcb 


L 00 


pipe O 1 L C ^ JlL LCO J 


3 


open files 


1UZ4 


V 1 [ LUd 1 IHclllU I y ^ KUy Lfcrb J 




-P U 1 1 III 1 u na 




core file size (blocks) 


unl i mi ted 


data seg size (kbytes) 


unl i mi ted 


file size (blocks) 


unl i mi ted 


max memory size (kbytes) 


unl i mi ted 


stack size (kbytes) 


unl i mi ted 


cpu time (seconds) 


unl i mi ted 


max user processes 


256 


pipe size (512 bytes) 


8 


open files 


1024 


virtual memory (kbytes) 
$ 


4194302 


Manifestement, sur notre machine, les fichiers d'initialisation de bash (/etc/profile) et de 


tcsh (/etc/csh.cshrc) sont configures avec les memes limitations pour les fichiers core. 


$ ulimit -t 240 




$ ulimit -c 100 




$ ulimit -tc 




core file size (blocks) 


100 


cpu time (seconds) 


240 


$ ulimit -He 1000 




$ ulimit -He 2000 




ulimit: cannot raise limit: Operation non permise 


$ ulimit -He 




1000 




$ ulimit -c 4000 




ulimit: cannot raise limit: Operation non permise 
$ 


On retrouve evidemment les memes restrictions quand on tente de relever une limite forte ou 


d'augmenter une limite soup 


e au-dessus de la valeur stricte correspondante. 


Nous allons a present etudier comment consulter et modifier une ressource a partir d'un 


programme C. La fonction getrl imit( ) dont nous avons fourni le prototype plus haut nous 


remplit une structure rl imit, contenant les membres suivants : 


Type Norn 


Signification 


rlim_t rlim_cur 


Limite souple (valeur actuelle) 


rlim_t rlim_max 


Limite stricte 
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Le type de donnee rl im_t est definie sous Linux, avec la GlibC , sur architecture PC comme 
un long int. Sur certaines machines, il peut toutefois s'agir d'un long long int. On peut 
done utiliser un format d'affichage long long pour etre tranquille. Voici un programme qui 
affiche les limites strictes, suivies des limites souples entre parentheses. 

exemple_getrlimit.c : 

//include <stdio.h> 
//include <stdlib.h> 
//include <unistd.h> 
//include <sys/time.h> 
//include <sys/resource.h> 



void affichage_limite (char * libelle, int numero); 



int 
main (void) 
{ 

affichage_limite("temps CPU en secondes 
affichage_limite("taille maxi d'un fichier 
affichage_limite("taille maxi zone de donnees 
affichage_limite("taille maxi de la pile 
affichage_limite("taille maxi fichier core 
affichage_limite("taille maxi residente 
aff i chage_l imitet "nombre maxi de processus 
affichage_limite("nombre de fichiers ouverts 
affichage_limite("taille memoire verrouillee 
return EXIT_SUCCESS; 

} 



, R L I M I T_ 


.CPU); 


, R L I M I T_ 


.FSIZE); 


, R L I M I T_ 


.DATA) ; 


, R L I M I T_ 


.STACK) ; 


, R L I M I T_ 


.CORE); 


, R L I M I T_ 


_RSS); 


, R L I M I T_ 


.NPROC); 


, R L I M I T_ 


.NOFILE) 


, R L I M I T_ 


.NOFILE) 



void 

affichage_limite (char * libelle, int numero) 
{ 

struct rlimit limite; 

if (getrl imit(numero, & limite) != 0) { 

fprintf (stdout, "Impossible d'acceder a la limite de $s\n", 
libelle); 

return ; 

} 

fprintf (stdout, "Limite de %s : ", libelle); 
if (limite. rlimjnax == RLIM_INFINITY) 
fprintf (stdout, "ill i mi tee "); 

el se 

fprintf (stdout, " % 1 1 d ", (long long int) (limite . rlimjnax)); 
if (limite. rlim_cur == RLIM_INFINITY) 
fprintf (stdout , "(ill imi tee)\n" ) ; 

el se 

fprintf (stdout, "Ulld)\n", (long long int) (limite . rlim_cur)); 
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Voici un exemple d' execution, qui nous fournit les memes resultats que les precedents exem- 
ples, directement depuis le shell. 

$ ./exemple_getrlimit 



Limite de nombre de fichiers ouverts : 1024 (1024) 
Limite de taille memoire verrouillee : 1024 (1024) 
$ 

La fonction setrl imi t( ) permet de fixer une limite, avec les restrictions que nous avons vues 
avec les shells. Le prototype de la fonction est : 

int setrlimit (int ressource, struct rlimit * limite); 



Attention 

Lorsqu'on desire modifier par exemple la limite souple, il est necessaire de lire auparavant I'ensemble de la 
structure rl i mi t correspondante afin d'avoir la bonne valeur pour la limite stride. En effet, les deux champs 
doivent etre correctement renseignes. 



On remarquera que le fait de diminuer une limite stricte ne reduit pas necessairement la limite 
souple correspondante. On peut temporairement se retrouver avec une limite souple supe- 
rieure a la limite stricte. Par contre, a la tentative suivante de modification de la limite souple, 
elle sera soumise a la nouvelle restriction. 

II faut egalement savoir que meme root ne peut pas augmenter le nombre de fichiers ouverts 
simultanement ( R L I M I T_N 0 F I L E) au-dessus de la limite imposee par le noyau (NR_0PEN defini 
dans <1 inux/1 imi ts . h>). 

L'exemple que nous allons developper sert a eviter la creation de fichier core au cas ou le 
programme plante. Pour simuler un bogue, nous allons nous envoyer le signal SIGSEGV 
(violation memoire), qui arrete le programme avec, en principe, la creation d'une image 
memoire sur le disque. Nous allons, pour affiner encore cette gestion de la phase de debo- 
gage, encadrer la suppression des fichiers core par des directives #1fdef-#end1f concernant 
la constante symbolique NDEBUG. Le fait de definir cette constante permet, rappelons-nous, 
d'eliminer du programme toutes les macros as sert ( ) qui servent a surveiller les conditions 
de fonctionnement du programme. Ainsi, si on ne definit pas la constante, les assertions 
seront incorporees, et en cas d'arret anormal du programme, l'image memoire core servira a 
un debogage post-mortem du processus. De meme, lorsqu'on definira la constante NDEBUG, on 
basculera en code de production, supprimant les assertions, et ramenant a zero la taille limite 
des fichiers core. 



Limite de temps CPU en secondes 
Limite de taille maxi d'un fichier 



illimitee (ill imi tee) 

illimitee (illimitee) 

illimitee (illimitee) 

illimitee (8388608) 



Limite de taille maxi zone de donnees 



Limite de taille maxi de la pile 

Limite de taille maxi fichier core 

Limite de taille maxi residente 

Limite de nombre maxi de processus 



illimitee (1024000000) 
illimitee (illimitee) 
256 (256) 
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exemple setrlimit.c : 

#include <stdio.h> 
#1nclude <stdlib.h> 
#include <unistd.h> 
#include <signal .h> 
#include <sys/resource.h> 

int 
main (void) 
{ 

#ifdef NDEBUG 

struct rlimit limite; 

if (getrl imi t( RLIMIT_CORE , & limite) != 0) { 

fprintf (stderr, "Impossible d'acceder a RLIMIT_C0RE\n" ) ; 
return EXIT_FAI LURE ; 

} 

limite.rlim_cur = 0; 

if (setrlimit (RLIMIT_C0RE, & limite) != 0) { 

fprintf (stderr, "Impossible d'ecrire RLIMIT_C0RE\n" ) ; 
return EXIT_FAI LURE ; 

} 

fprintf (stdout, "Code definitif, \"core\" evite \n"); 
#else 

fprintf (stdout, "Code de developpement, \"core\" cree si besoin \n"); 
#endif 

/* 

* Et maintenant. . . on se plante ! 
*/ 

raise(SIGSEGV); 
return EXIT_SUCCESS; 

} 

Voici des exemples d' execution du programme en fonction des differentes directives de 
compilation : 

$ cc -Wall exemple_setrlimit.c -o exemple_setrlimit 
$ ./exemple_setrl imit 

Code de developpement, "core" cree si besoin 
Segmentation fault (core dumped) 
$ rm core 

$ cc -Wall -DNDEBUG exempl e_setrl imit.c -o exemple_setrl imit 
$ ./exemple_setrlimit 

Code definitif, "core" evite 
Segmentation fault 
$ Is core 

Is: core: Aucun fichier ou repertoire de ce type 
$ 
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Conclusion 

Lorsqu'un processus doit se mettre en attente pendant une periode determinee, il existe 
plusieurs methodes de sommeil avec des durees plus ou moins precises, que nous avons 
etudiees en detail dans ce chapitre. Nous reviendrons plus longuement sur les notions concer- 
nant la date et l'heure dans le chapitre 25. 

Nous avons vu que les sommeils et les temporisations sont limites par la precision de Fordon- 
nanceur, soit 1 milliseconde pour les noyaux 2.6. Lorsqu'il est necessaire d' avoir une 
meilleure precision, il faudra se tourner vers des versions de Linux modifiees pour le temps- 
reel strict (hard realtime) comme RTAI. 

Nous avons egalement observe les fonctions permettant d'obtenir des informations sur 1' utili- 
sation des ressources systeme par un processus et de limiter cet acces aux ressources afin de 
ne pas leser les autres utilisateurs. 
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Flux standard d un processus 

Les entrees-sorties sous Linux sont uniformisees par l'intermediaire de fichiers. Nous 
verrons, dans la partie consacree a la gestion des fichiers, qu'on peut y acceder grace a des 
primitives de bas niveau (des appels-systeme) gerant des descripteurs ou par des fonctions de 
haut niveau (de la bibliotheque C) manipulant des flux. 

Les flux sont une abstraction ajoutant automatiquement aux descripteurs de fichiers des 
tampons d' entree-sortie, des verrous, ainsi que des rapports d'etat et d'erreur plus fins. Les 
flux sont du type opaque FILE, defini dans <stdi o . h> (ou plutot dans <1 i bi o . h> , inclus par ce 
dernier). On ne doit pas tenter d' acceder aux membres internes de la structure FI LE, pas plus 
qu'on ne doit utiliser d'objets de type FILE, mais uniquement des pointeurs sur ces objets. 
Les allocations et liberations de memoire necessaires sont entierement gerees par les fonc- 
tions de la bibliotheque C. 

Lorsqu'on desire acceder a un fichier par l'intermediaire d'un flux, on invoque la fonction 
fopen( ) , que nous decrirons plus en detail dans le chapitre 18. Cette fonction prend en argu- 
ment le nom du fichier desire, ainsi qu'une chaine de caracteres indiquant le mode d'acces 
voulu, et renvoie un pointeur sur un flux de type FI LE *. On l'utilise ainsi 

FILE * fp; 

fp = fopen ("mon_fichier.txt", "r"); 

pour ouvrir le fichier en lecture seule (mode r - read). Le pointeur de flux renvoye peut alors 
etre utilise pour lire des donnees. Si on ouvrait notre fichier en mode ecriture w, write, on 
pourrait alors y ecrire des informations. 

Nous detaillerons toutes ces notions plus loin, mais ce qui nous interesse pour l'instant c'est 
que tout programme s'executant sous Linux dispose de trois flux ouverts automatiquement 
lors de son demarrage. 
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Ces trois flux sont declares dans <stdi o . h> : 

• stdin : flux d'entree standard. Ce flux est ouvert en lecture seule ; il s'agit par defaut du 
clavier. Le processus peut y recevoir ses donnees. 

• stdout : flux de sortie standard. Ouvert en ecriture seule, le processus y affiche ses resul- 
tats normaux. Par defaut, il s'agit de l'ecran de l'utilisateur. 

• stderr : flux d'erreur standard. Ce flux, ouvert en ecriture seule, sert a afficher des infor- 
mations concernant le comportement du processus ou ses eventuels problemes. Par defaut, 
ces informations sont egalement affichees sur l'ecran de l'utilisateur. 

Nous arrivons ici a Fun des principes de la conception meme des systemes Unix. Dans cet 
environnement, une grande partie des outils et des commandes de base sont vus comme des 
filtres. lis recoivent des donnees en entree, les transforment, et fournissent leurs resultats en 
sortie. En cas de probleme, l'utilisateur est averti par un message qui s' affiche sur un flux de 
sortie distinct. 

II est possible, au niveau du shell, de rediriger les flux d'entree ou de sortie d'un processus a 
volonte. On peut rediriger par exemple la sortie d'un programme vers un fichier en utilisant 
l'operateur > : 

$ mon_programme > sortie.txt 

A ce moment, toutes les donnees ecrites sur stdout seront envoyees dans le fichier concerne. 
Les informations relatives a stderr resteront sur l'ecran. 

On peut egalement rediriger F entree standard pour lire les donnees depuis un fichier avec 
l'operateur < ; 

$ mon_programme < entree.txt 

On peut orienter la sortie standard d'un processus directement vers 1' entree standard d'un 
autre en utilisant l'operateur | : 

$ programme_l | programme_2 

Cette operation est souvent effectuee pour renvoyer les donnees vers un utilitaire de pagina- 
tion comme more ou less. Dans ce dernier cas egalement, les informations de diagnostic 
provenant de programmed et envoyees sur stderr sont affichees a l'ecran, et ne sont pas 
melees aux donnees de stdout, qui sont dirigees vers programme_2. 

Pareillement, il est possible de proceder a d'autres interventions, comme ajouter la sortie 
standard en fin de fichier sans ecrasement, regrouper la sortie d'erreur et la sortie standard, 
lire des donnees directement depuis la ligne de commande ou le script shell utilises. Ces 
operateurs peuvent varier suivant le shell employe. On se reportera, pour plus de details, aun 
ouvrage traitant de la programmation sous shell ou a la page de manuel de Finterpreteur 
concerne. 

En fait, les notions d'entree standard, de sortie standard et de sortie d'erreur sont des concepts 
de Funivers Unix qui n'ont pas de reelle signification au niveau du noyau. II s'agit simple- 
ment d'une convention institute par les shells historiques (et qui risque fort de tomber peu a 
peu en desuetude avec Favenement des environnements uniquement graphiques). 
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Dans ce chapitre, nous allons nous interesser a la presentation ou a la lecture de donnees 
sous forme de textes, lisibles par un etre humain. Toutefois, les flux standard d'un proces- 
sus peuvent egalement etre utilises pour transporter des donnees binaires. Cela permet de 
construire une serie de petits outils independants qu'on regroupe ensuite. Lorsque nous abor- 
derons la programmation reseau, nous etudierons un programme capable de recevoir des 
donnees sur un port reseau UDP/IP et de les ecrire sur sa sortie standard. De meme, un autre 
programme lira son entree standard et enverra les informations vers le port UDP/IP d'une 
autre application. Ces programmes s'appelleront respectivement udp_2_stdout et stdin_2_ 
udp (le 2 doit se lire two, ou plutot to, c'est-a-dire « vers » ; c'est une tradition de nommer 
ainsi les programmes de filtrage servant a changer le format de leurs donnees). 

Imaginons qu'on ait un autre programme nomme converti sseur, qui modifie les informations 
recues sur son entree standard pour les renvoyer en sortie. Avec ces trois outils, nous pouvons 
obtenir toutes les possibilites suivantes : 

• Enregistrement de donnees provenant d'une application serveuse : 
$ udp_2_stdout > fichier_l 

• Relecture des donnees et emission vers 1' application cliente : 
$ stdin_2_udp < fichier_l 

• Passerelle entre deux reseaux, par exemple : 
$ udp_2_stdout | stdin_2_udp 

• Conversion des donnees « a froid » : 

$ converti sseur < fichier_l > fichier_2 

• Conversion « au vol » des donnees : 

$ udp_2_stdout | converti sseur | stdin_2_udp 

• On peut les inserer dans un filtre entre deux programmes : 
$ programme_l | programme_2 

qu'on transforme en : 

$ programme_l | stdin_2_udp 
sur une machine, et : 

$ udp_2_stdout | programme_2 
sur une autre machine. 

Nous voyons la puissance des redirections des flux standard des processus. Ces exemples ne 
sont pas artificiels, je les ai personnellement utilises dans une application industrielle pour 
convertir au vol des donnees provenant d'un radar et les rendre compatibles avec une applica- 
tion de visualisation se trouvant sur une autre machine. Le fait de pouvoir enregistrer des 
donnees ou intercaler un programme d'affichage hexadecimal des valeurs en modifiant 
simplement le script shell de lancement aide grandement a la mise au point du systeme. 
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Ecriture formatee dans un flux 

L'une des taches premieres des programmes informatiques est d'afficher des messages lisi- 
bles par les utilisateurs sur un peripherique de sortie, generalement l'ecran. La preuve en est 
donnee dans le celebre hello. c [KERNIGHAN 1994], dont l'unique role est d'afficher « hello 
world ! » et de se terminer normalement 1 . 

#include <stdio.h> 
ma i n ( ) 
{ 

printf( "Hello, world \n"); 

} 

Lorsqu'il s'agit d'une chaine de caracteres constante, comme dans ce fameux exemple, le 
travail est relativement simple - il suffit d'envoyer les caracteres l'un apres l'autre sur le flux 
de sortie -, mais les choses se compliquent nettement quand il faut afficher des valeurs nume- 
riques. La conversion entre la valeur 2005, contenue dans une variable de type int, et la serie 
de caracteres '2', '0', '0' et '5' n'est deja pas une tache simple. Ce qui se presente comme un 
exercice classique des premiers cours d'assembleur se corse nettement lorsqu'il faut gerer les 
valeurs signees, puis differentes bases d'affichage (decimal, hexa, octal). Imaginez alors la 
complexite du travail qui est necessaire pour afficher le contenu d'une variable en virgule flot- 
tante, avec la multitude de formats possibles et le nombre de chiffres significatifs adequat. 

Heureusement, la bibliotheque C standard nous offre les fonctions de la famille pri ntf ( ), qui 
permettent d'effectuer automatiquement les conversions requises pour afficher les donnees. 
Ces routines sont de grands classiques depuis les premieres versions des bibliotheques 
standard du langage C, aussi nous ne detaillerons pas en profondeur chaque possibilite de 
conversion. On pourra, pour avoir plus de renseignements, se reporter a la page de manuel 
printf (3). 

II existe quatre variantes sur le theme de pri ntf ( ), chacune d'elles etant disponible en deux 
versions, suivant la presentation des arguments. 

La fonction la plus utile est bien souvent fprintfO, dont le prototype est declare dans 
<stdio.h> ainsi : 

int fprintf (FILE * flux, const char * format, ...); 

Les points de suspension indiquent qu'on peut fournir un nombre variable d' arguments a cet 
emplacement. Le premier argument est le flux dans lequel on veut ecrire ; il peut s'agir bien 
entendu de stdout ou stderr, mais nous verrons ulterieurement qu'il peut s'agir aussi de 
n'importe quel fichier prealablement ouvert avec la fonction f open ( ). 

Le second argument est une chaine de caracteres qui sera envoyee sur le flux indique, apres 
avoir remplace certains caracteres speciaux qu'elle contient. Ceux-ci indiquent la conversion 
a apporter aux arguments situes a la fin de l'appel avant de les afficher. Par exemple, la 
sequence %d dans le format sera remplacee par la representation decimale de 1' argument de 
type entier situe a la suite du format. On peut bien entendu placer plusieurs arguments a affi- 
cher, en indiquant dans la chaine de format autant de caracteres de conversion. 



1. L' absence de return(O) n'est pas un oubli, mais est due a la volonte de reproduire exactement l'exemple original de 
Kernighan et de Ritchie. 
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Les conversions possibles avec la GlibC sont les suivantes : 



Conversion 


But 


U 


Afficher un nombre entier sous forme decimale signee. 


%\ Synonyme de U . 


%u 


Afficher un nombre entier sous forme decimale non signee. 


%0 


Afficher un nombre entier sous forme octale non signee. 


%x 


Afficher un entier non signe sous forme hexa avec des minuscules. 


U 


Afficher un entier non signe sous forme hexa avec des majuscules. 


%f 


Afficher un nombre reel en notation classique (3.14159). 


le. 


Afficher un reel en notation ingenieur (1 .602e-1 9). 


%E 


Afficher un reel en notation ingenieur avec E majuscule. 


%g 


Afficher un reel le plus lisiblement possible entre %f et %e suivant sa valeur. 


%G 


Comme %g . mais en choisissant entre %f et %L. 


%a 


Afficher un reel avec la mantisse en hexa et I'exposant de 2 en decimal. 


%k 


Comme %a , mais le « P » indiquant I'exposant de 2 est en majuscule. 


%c 


Afficher un simple caractere. 


%C 


Afficher un caractere large (voir chapitre 23). 


%s 


Afficher une chaine de caracteres. 


%S 


Afficher une chaine de caracteres larges. 


%p 


Afficher la valeur d'un pointeur. 


In 


Memoriser le nombre de caracteres deja ecrits (voir plus bas). 


%m 


Afficher la chaine de caracteres decrivant le contenu de errno. 


%% 




Afficher le caractere de pourcentage. 



Notons tout de suite que %m est une extension Gnu, qui correspond a afficher la chaine de 
caracteres strerror(errno). Signalons egalement que la conversion %n est ires particuliere 
puisqu'elle n'ecrit rien en sortie, mais stocke dans F argument correspondant, qui doit etre un 
pointeur de type i nt *, le nombre de caracteres qui a deja ete envoye dans le flux de sortie. 
Cette fonctionnalite n'est pas couramment employee ; on peut imaginer l'utiliser avec 
sprintfO, que nous verrons ci-dessous, pour memoriser Femplacement des champs de 
donnees successifs si on desire y acceder a nouveau par la suite. 

La conversion %n peut introduire des failles de securite par ecrasement de memoire. Si l'utili- 
sateur peut fixer lui-meme le format de sortie de printf ( ), il dispose d'un moyen d'ecrire 
dans la memoire du processus et de lui faire ainsi executer n'importe quel code. Ceci est tres 
dangereux pour un programme Set-UID ou un demon reseau. L'affichage avec printfO 
d'une chaine de caracteres fournie par l'utilisateur se fera avec printfCIs", chaine) et 
jamais printf(chaine). 

Les autres conversions sont tres classiques en langage C et ne necessitent pas plus de details 
ici. Voyons un exemple d'utilisation des diverses conversions. 
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exemple_fprintf_1.c : 

//include <stdio.h> 
//include <stdlib.h> 
//include <limits.h> 



int 
main (void) 
{ 



int 




d 




INTJIAX; 


unsigned 


int 


u 




UINT_MAX; 


unsigned 


int 


0 




INT_MAX; 


unsigned 


int 


X 




UINT_MAX; 


unsigned 


int 


X 




UINT_MAX; 


doubl e 




f 




1.04; 


doubl e 




e 




1500; 


doubl e 




E 




101325; 


doubl e 




g 




1500; 


doubl e 




G 




0.00000101325; 


doubl e 




a 




1.0/65536.0; 


doubl e 




A 




0.125; 


char 




c 




'a ' ; 


char 




s 




"chaine" ; 


void 




P 




(void *) main; 



fprintf (stdout, " d=£d \n u=£u \n o=£o \n x=%x \n X=£X \n" 

" f=^f \n e=^e \n E=£E \n g=£g \n G=£G \n" 

" a=£a \n A=£A \n c=£c \n s=£s \n p=%p \n", 

d, u, o, x, X, f, e, E, g, G, a, A, c, s, p); 

return EXIT_SUCCESS; 



} 



Bien sur, les valeurs INT_MAX et U I NT_MAX definies dans <1 imi ts . h> peuvent varier avec 1' archi- 
tecture de la machine. 

$ ./exemple_fprintf_l 

d=2147483647 
u=4294967295 
0=17777777777 
x=ffffffff 
X=FFFFFFFF 
f=l. 040000 
e=1.500000e+03 
E=l . 013250E+05 
g=1500 

G=l . 01325E-06 
a=0xlp-16 
A=0XlP-3 
c=a 

s=chaine 
p=0x80483f0 

$ 
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On peut incorporer, comme dans n'importe quelle chaine de caracteres en langage C, des 
caracteres speciaux comme \n, \r, \t..., qui seront interpreted par le terminal au moment de 
Faffichage. 

Entre le symbole % et le caractere indiquant la conversion a effectuer, on peut inserer plusieurs 
indications permettant de modifier la conversion ou de preciser le formatage, en termes de 
largeur minimale ou maximale d'affichage. 

Le premier indicateur qu'on peut ajouter concerne le formatage. II sert principalement a 
specifier sur quel cote le champ doit etre aligne. A la suite de cet indicateur peut se trouver un 
nombre signalant la largeur minimale du champ. On justifie ainsi des valeurs en colonne. On 
peut encore inclure un point, suivi d'une deuxieme valeur marquant la precision d'affichage 
de la valeur numerique. Un dernier modificateur peut etre introduit afin de preciser comment 
la conversion de type doit etre effectuee a partir du type effectif de la variable transmise en 
argument. 

Pour les conversions entieres (%d, %i, %u, to, %x, XX) ou reelles (%f, %e, %E, %g, %G), on peut 
utiliser - en premier caractere - les indicateurs de formatage suivants : 



Caractere 


Formatage 


+ Toujours afficher le signe dans les conversions signees. 


Aligner les chiffres a gauche et non a droite. 


espace 


Laisser un espace avant les chiffres positifs d'une conversion signee. 


0 (zero) 


Completer le chiffre par des zeros au debut plutot que par des espaces a la fin. 


# 


Prefixer par Ox ou OX les conversions hexadecimales, et par 0 les conversions octales. Le resultat 
peut ainsi etre relu automatiquement. 



Avec les conversions affichant un caractere (%c), une chaine (%s) ou un pointeur (Hp), seul 
Findicateur « - » peut etre utilise, afin d'indiquer une justification a gauche du champ. 

A la suite de ce modificateur, on indique eventuellement la largeur minimale du champ. Si la 
valeur a afficher est plus longue, elle debordera. Par contre, si elle est plus courte, elle sera 
alignee a droite ou a gauche, et completee par des espaces ou par des zeros suivant le forma- 
tage vu precedemment. 

Apres la largeur minimale du champ, on peut placer un point suivi de la precision de la valeur 
numerique. La precision correspond au nombre minimal de chiffres affiches dans le cas d'une 
conversion entiere et au nombre de decimales lors des conversions de nombres reels. Voici 
quelques exemples de formatage en colonne. 

exemplejprintf 2.c: 

#include <stdio.h> 
finclude <stdlib.h> 

int 
main (void) 

{ 

int d; 



234 



Programmation systeme en C sous Linux 



fprintf (stdout, 



H+6d I H-6d I %%-+6d\ 



6d I %%Q6d |\n" 



fprintf (stdout, "+-- 


+-- 


+- 





-+ — 


---+-- 


— 


-+-- 


--- 


-+\r 


") 






d = 0; 

fprintf (stdout, " \%6 


d | %+6d | 


%-6d\i 


-+6d 


% 6d 


%06d 


\n" 


d, 


d. 


d. 


d, 


d, 


d 


d = 1; 

fprintf (stdout, " \%6 


d | %+6d | 


%-6d\i 


-+6d 


% 6d 


%06d 


\n" 


d, 


d. 


d. 


d, 


d, 


d 


d = -2; 

fprintf (stdout. " \%6 


d | %+6d | 


%-6d | ^ 


-+6d 


% 6d 


%06d 


\n" 


d, 


d. 


d, 


d, 


d, 


d 


d = 100; 


























fprintf (stdout, " \%6 


d | %+6d | 


%-6d\i 


-+6d 


% 6d 


%06d 


\n" 


d, 


d, 


d. 


d, 


d, 


d 


d = 1000; 


























fprintf (stdout, " \%6 


d | %+6d | 


%-6d | S 


-+6d 


% 6d 


%06d 


\n" 


d, 


d, 


d, 


d, 


d, 


d 


d = 10000; 


























fprintf (stdout, " \%6 


d | %+6d | 


%-6d\i 


-+6d 


% 6d 


%06d 


\n" 


d. 


d. 


d. 


d, 


d, 


d 


d = 100000; 


























fprintf (stdout, " \%6 


d | %+6d | 


%-6d\i 


-+6d 


% 6d 


%06d 


\n" 


d, 


d. 


d. 


d, 


d, 


d 



return EXIT_SUCCESS ; 



$ ./exemple_fprintf_2 



%6d 


%+6d 


%-6d 


| %-+6d| 


% 6d 


%06d | 




-+ +- 


+ + 


0 


+0 


0 


|+0 | 


0 


ooooooi 


1 


+1 


1 


1+1 1 


1 


000001 


-2 


-2 


-2 


1-2 I 


-2 


-00002 


100 


+100 


100 


|+100 | 


100 


000100 


1000 


+1000 


1000 


j+1000 j 


1000 


001000 


10000 


+10000 


10000 


j+iooooj 


10000 


010000 



100000 



+100000 I 100000 1+100000 I 100000 I 100000 I 



Nous voyons que l'indication de largeur du champ correspond bien a une largeur minimale, 
un debordement pouvant se produire, comme c'est le cas sur la derniere ligne si le signe est 
affiche. L'exemple suivant montre l'effet de l'indicateur de precision sur des conversions 
entieres et reelles. 

exemple_fprintf_3.c : 

#include <stdio.h> 
#include <stdlib.h> 

int 
main (void) 
{ 

int d; 
double f; 

fprintf (stdout, "| 
"I 

fprintf (stdout, "+- 
"+- 

d - 0; 



i.Od 
i.2f 



%%8.2d 
%%8.Ze 

+- 



%%8.0f " 
%%8.Zg |\n" 

+\n") : 
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f = 0.0; 
fprintf (stdout 



" | %8 . Od | %8 . 2d | %8 . Of |%8 
d, d, f, f, f, f); 



2f |*8.2e|%8.2g|\n" , 



d = 1; 
f = 1.0; 
fprintf (stdout 



" | %8 . Od | %8. 2d | %8 . Of | %8 
d, d, f, f, f, f); 



2f |%8.2e|%8.2g| \n" . 



d = -2; 
f = -2.0; 
fprintf (stdout 



" | %8 . Od | %8 . 2d | %8 . Of |%8 
d, d, f, f, f, f); 



2f |*8.2e[%8.2g|\n" , 



d = 10; 
f = 10.1; 
fprintf (stdout 



" | %8 . Od | %8. 2d | %8 . Of | %8 
d, d, f, f, f, f); 



2f |%8.2e|%8.2g| \n" . 



d = 100; 
f = 100.01; 

fprintf (stdout, " | %8 . Od | %8 . 2d | %8 . Of |%8.2f | %8 . 2e | %8 . 2g | \n " , 

d, d, f, f, f, f); 
return EXIT_SUCCESS; 

} 

$ ./exemple_fprintf_3 



+ 



Od | S 


58. 2d | 3 


,8. Of | 


%8.2f | %8.2e | 


%8.2g | 


— +--- 


+--- 


+- 




+ 




00 | 


0| 


0 . 00 | 0 . 00e+00 | 


0| 


1| 


01| 


11 


1.00 l.OOe+Ooj 


11 


-2 


-02 j 


-z| 


-2.00 -2.00e+00| 


-2 


10 1 


10| 


10 1 


10.10 j 1 . 01e+01 | 


10 1 


100 


100 1 


100 1 


100.01 [ l.OOe+02 j 


le+02 | 



Notons la encore que la largeur indiquee peut etre depassee au besoin (comme avec -2 en 
notation exponentielle). La precision correspond bien au nombre minimal de chiffres affiches 
pour les entiers et au nombre de decimales pour les reels. 

Enfin, le dernier indicateur est un modificateur qui precise le type reel de 1' argument transmis, 
avant sa conversion. Avec les conversions entieres, les modificateurs suivants sont autorises : 



Modificateur 


Effet 


h 


L'argument est un short int ou un unsigned short int. 


hh 


L'argument est un char ou un unsigned char. 


1 [.'argument est un long int ou un unsigned long int. 


11, L, ou q 


L'argument est un long long int, parfois nomme « quad » sur d'autres systemes. 


t 


L'argument est de type ptrdiff_t. 



z L'argument est de type size_t ou ssize_t. 



$ 



Le choix entre le type signe ou non depend du type de conversion qui suit le modificateur (%d 
ou %u , par exemple). 
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ptrdiff_t sert lorsqu'on effectue manuellement des operations arithmetiques sur les poin- 
teurs. Le type size_t ou sa version signee ssize_t servent a mesurer la taille des donnees. 

Avec les conversions reelles, tout type de donnee est promue au rang de double avant d'etre 
affichee. On peut eventuellement utiliser le modificateur L, qui indique que 1' argument est de 
type 1 ong doubl e. II n'y a pas d'autre modificateur pour les conversions reelles. 

Nous allons a present observer quelques particularites moins connues de fprintfO : la 
largeur de champ variable et la permutation des arguments. Si on remplace la largeur mini- 
male du champ ou la precision numerique par un asterisque, la valeur sera lue dans 1' argu- 
ment suivant de fprintfO. Cela permet de fixer la largeur d'un champ de maniere dyna- 
mique. En voici une demonstration. 

exemple_fprintf_4.c : 

#include <stdio.h> 
//include <stdlib.h> 

int 
main (void) 
{ 

int largeur; 
int nb_chiffres; 

for (largeur = 1; largeur < 10; largeur ++) 

fprintf (stdout, "|%*d|\n", largeur, largeur); 
for (nb_chiffres = 0; nb_chiffres < 10; nb_chiffres ++) 

fprintf (stdout, "|%.*d[\n", nb_chiffres. nb_chiffres) ; 
return EXIT_SUCCESS; 




$ . /exemple_fprintf_4 



11 

2| 
3| 



4| 
5| 
6| 

n 

8| 
9| 



1| 

02 1 

003 1 

0004 1 

00005| 

000006| 

0000007| 

00000008| 

000000009| 



$ 
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L'interet de cette caracteristique est principalement de pouvoir fixer la largeur des colonnes 
d'un tableau pendant l'execution du programme (eventuellement apres avoir verifie que la 
plus grande valeur y tient). 

La permutation de parametre est une deuxieme particularite peu connue de fprintfO. On 
peut indiquer en tout debut de conversion, juste apres le symbole %, le numero du parametre 
qu'on desire convertir, suivi du signe $. Ce numero doit etre superieur ou egal a 1, et inferieur 
ou egal au rang du dernier argument transmis. Si on utilise cette possibility, il faut necessaire- 
ment le faire pour toutes les conversions lors de l'appel de fprintf ( ), sinon le comportement 
est indefini. L'utilite de cette fonctionnalite est de permettre de preciser l'ordre des arguments 
au sein meme de la chaine de formatage. Une application evidente est d'ordonner correcte- 
ment les jours, mois et annee de la date en fonction des desirs de l'utilisateur, uniquement en 
selectionnant la bonne chaine de formatage. 

exemple_fprintf_5.c : 

#include <stdio.h> 
^include <stdlib.h> 
#include <time.h> 

int 
main (void) 

{ 

int i ; 

char * format[2] = 

{ "La date est *3$02d/3:2$02dm$02d\n" , 
"Today is %l$02d %2$02d ^3$02d\n" }; 

time_t timer; 
struct tm * date; 

time(& timer) ; 

date = localtime(& timer); 

for (i = 0; i < 2; i ++) 
fprintf (stdout, format[i], 

date->tm_year % 100, 
date->tm_mon + 1, 
date->tm_mday ) ; 

return EXIT_SUCCESS; 

} 

$ ./exemple_fprintf_5 

La date est 31/12/04 
Today is 04 12 31 
$ 

On voit la puissance de cette fonctionnalite, qui permet de profiter de la phase de traduction 
des messages pour reordonner correctement les champs suivant la localisation. 



238 



Programmation systeme en C sous Linux 



Autres fonctions d'ecriture formatee 

Toutes les fonctions de la famille pri ntf ( ) renvoient le nombre de caracteres ecrits en sortie, 
ou une valeur negative en cas d'erreur. Cette valeur est rarement utilisee, aussi certains pro- 
grammeurs prefixent tous leurs appels a ces fonctions d'un (void) destine a indiquer aux outils 
de verification de code, comme lint, que la valeur de retour est volontairement ignoree. Sous 
Linux, tout cela n'est pas necessaire car Mint, Foutil standard de verification de code, reconnait 
les fonctions de la famille pri ntf ( ) et sait que leurs valeurs de retour peuvent etre ignorees. 

La fonction pri ntf ( ), dont le prototype est 

int printf (const char * format, ...); 

est exactement equivalente a f pri ntf (stdout, format, ...). Personnellement, je prefere 
utiliser systematiquement f pri ntf ( ) et indiquer explicitement, a chaque ecriture, dans quel flux 
(stdout ou stderr) les donnees doivent etre dirigees. C'est une simple question d'habitude. 

La fonction sprintf ( ) est declaree ainsi : 

int sprintf (char * buffer, const char * format, ...); 

Elle permet d'ecrire les donnees formatees dans la chaine fournie en premier argument, en 
ajoutant un caractere nul \0 a la fin. Ce caractere nul n'est pas compte dans la valeur renvoyee 
par sprintf ( ). 

Avec le developpement des applications graphiques dans des environnements fenetres, 
l'utilite de f pri ntf ( ) sur le flux de sortie stdout est de plus en plus reduite. Les programmes 
preferent envoyer leur sortie sur des composants graphiques (widgets) effectuant l'affichage 
de maniere beaucoup plus esthetique. II est alors courant de mettre les donnees en forme dans 
une chaine de caracteres, qu'on transmet ensuite a la bibliotheque graphique. 

La chaine de caracteres envoyee en premier argument doit etre assez grande pour contenir 
toutes les donnees affichees, y compris le caractere nul final. II est alors necessaire de dimen- 
sionner correctement cette chaine, ce qui peut se reveler difficile. 



Attention 

Le fait de deborder d'une chaine lors d'une ecriture est I'une des pires choses qui puisse arriver a un 
programme : non seulement son comportement sera errone, mais en plus les dysfonctionnements se produi- 
ront intempestivement, et les symptomes seront variables. Le programme peut essayer d'ecrire en dehors de 
ses limites d'adressage autorisees, ce qui le conduit a se terminer a cause du signal SIGSEGV. II peut aussi 
corrompre les donnees se trouvant au-dela de la chaine et avoir alors un comportement indefini. Mais, le plus 
grave, c'est que cette erreur peut etre employee volontairement par un pirate pour creer une faille de securite 
dans le systeme. Nous reparlerons de ce probleme dans le paragraphe consacre a la saisie de chaines de 
caracteres. 



Ce probleme ne se pose pas avec pri ntf () ou fprintfO, car 1' ecriture dans un flux n'est pas 
limitee (ou du moins les limites sont gerees par le noyau lors de P ecriture effective, et la fonc- 
tion echoue proprement). 

II existe une fonction snprintf ( ) , avec le prototype suivant, permettant de regler en partie le 
probleme : 

int snprintf (char * buffer, size_t taille, const char * format, ...); 
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Cette fonction ecrira au maximum tai 1 1 e caracteres, y compris le nul final. Comme le carac- 
tere nul n'est pas compte dans la valeur de retour, cette valeur doit toujours etre strictement 
inferieure a tai lie. Si le retour est superieur ou egal a tai 1 1 e, snpri ntf ( ) nous indique alors 
que la chaine est trop petite et que le formatage a ete tronque. Sur d'autres systemes, 
snpri ntf ( ) renvoie -1 en cas de depassement. 

Comme il est difficile de dimensionner au depart la chaine correctement, on peut proceder en 
plusieurs etapes. Nous allons construire une routine utilitaire, qui va allouer automatiquement 
une chaine de caracteres de la dimension necessaire. La liberation de cette chaine apres emploi 
est sous la responsabilite du programme appelant. 

Pour construire cette routine, nous appellerons la routine vsnpri ntf ( ) , dont Femploi est plus 
simple dans notre cas. Les routines vprintfO, vfprintfO, vsprintfO et vsnpri ntf () fonc- 
tionnent exactement comme leurs homologues sans « v » initial, mais recoivent les arguments 
a afficher dans une table de type va_l i st, et pas sous forme de liste variable d' arguments. Le 
type va_l i st est defini dans <stdarg . h>, ainsi que des macros qui permettent de passer d'une 
liste variable d' arguments a une table qu'on peut parcourir. Les prototypes de ces quatre 
autres fonctions de la famille printf ( ) sont : 

int vprintf (const char * format, va_list arguments); 
int vfprintf (FILE * flux, const char * format, va_list arguments); 
int vsprintf (char * buffer, const char * format, va_list arguments); 
int vsnprintf (char * buffer, size_t taille, 

const char * format, va_list arguments); 

Au sein d'un programme, il est beaucoup plus simple d'invoquer les routines printf ( ) que 
vprintfO lorsqu'on connait le nombre d'arguments a transmettre lors de l'ecriture du 
programme. Ce cas est bien entendu le plus frequent. Par contre, il peut arriver qu'on ne sache 
pas a Favance quels seront les arguments a transmettre, ni meme leur nombre. Cette situation 
se presente par exemple lorsque la mise en forme et les donnees a afficher sont choisies dyna- 
miquement par l'utilisateur. Un autre exemple est celui d'une routine qui sert de frontal a 
printf ( ), en offrant une interface assez similaire pour le programmeur qui l'invoque, mais 
qui effectue des taches supplementaires (comme une verification des donnees) avant 
d'appeler effectivement printf ( ). II faut alors invoquer la version v de cette fonction, en lui 
passant un tableau construit dynamiquement. Nous avons deja rencontre la meme dualite 
entre tableaux et listes variables d'arguments dans le chapitre 4, avec les fonctions de la 
famille exec( ). 

Voici un exemple d' implementation d'une routine semblable a sprintf ( ), mais qui allouera 
automatiquement l'espace necessaire pour ecrire toutes les donnees. Elle tente de faire son 
allocation par etapes successives de 64 caracteres (valeur purement arbitraire). Elle renvoie 
un pointeur NULL en cas d'echec d' allocation memoire. 

exemple_vsnprintf.c : 

#i nclude <stdarg.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 

char * alloc_printf (const char * format, ...); 
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int 
main (void) 
{ 

char * buffer; 

char * seizecars = "0123456789ABCDEF" ; 

buffer = alloc_printf(" %s %s", 

seizecars, seizecars); 
if (buffer != NULL) { 

fprintf (stdout, "ChaTne de %d caracteres \n %s \n", 
strl en(buffer) , buffer); 

f ree(chaine) ; 

} 

buffer = alloc_printf (" Is %s Is Is", 

seizecars, seizecars, seizecars, seizecars); 
if (buffer != NULL) { 

fprintf (stdout, "Chatne de %d caracteres \n %s \n", 
strl en(buffer) , buffer); 

f ree(buffer) ; 

} 

return EXIT_SUCCESS; 



char * 

alloc_printf (const char * format, ...) 
{ 

va_list arguments; 
char * retour = NULL; 
int taille = 64; 
int nb_ecrits; 

va_start(arguments, format); 
while (1) { 

retour = realloc(retour, taille); 

if (retour == NULL) 
break; 

nb_ecrits = vsnprintf (retour, taille, format, arguments); 
if ((nb_ecrits >= 0) && (nb_ecrits < taille)) 

break; 
taille = taille + 64; 

} 

va_end(arguments) ; 
return retour; 

} 

Nous appelons deux fois cette routine. La premiere, avec deux chames de 16 caracteres, plus 
deux caracteres blancs, ce qui tient nettement dans la tentative d' allocation initiale de 
64 octets. Par contre, lors du second appel, on depasse volontairement ces 64 caracteres pour 
forcer une reallocation automatique. 

Apres utilisation de la chaine renvoyee, on prend soin de liberer la memoire. 
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$ ./exemple_vsnprintf 

Chaine de 34 caracteres 

0123456789ABCDEF 0123456789ABCDEF 
Chaine de 71 caracteres 

0123456789ABCDEF 0123456789ABCDEF 0123456789ABCDEF 0123456789ABCDEF 

$ 

Cette routine peut etre tres utile pour remplir une chaine de caracteres avant de la transmettre 
a une boite de dialogue d'une bibliotheque graphique. On est assure qu'aucun debordement 
de chaine ne risque de se produire. 

Ecritures simples de caracteres ou de chaTnes 

La fonction la plus simple pour ecrire un unique caractere dans un flux est fputc( ), declaree 
ainsi dans <stdi o . h> : 

int fputc tint c, FILE * flux); 

Lorsqu'on passe un caractere en argument a f putc( ), il est tout d'abord converti en i nt avant 
l'appel, puis a nouveau transforme en unsigned char (prenant done n'importe quelle valeur 
entre 0 et UCHAFLMAX, normalement 255). II est ensuite envoye dans le flux indique. Si une 
erreur se produit, fputc( ) renvoie EOF, sinon elle renvoie la valeur du caractere emis. 

L'exemple suivant va mettre en relief les divers comportements de fputc ( ) en fonction de ses 
arguments. 

exemplejputc.c : 

#include <stdio.h> 
#include <limits.h> 

void test_fputc (int valeur, FILE * fp); 

int 
main (void) 

{ 

test_fputc( 'A' , stdout); 
test_fputc(65 , stdout); 
test_fputc(UCHAR_MAX, stdout); 
test_fputc(-l , stdout); 
test_fputc( ' A' , stdin); 
return EXIT_SUCCESS; 

} 

void 

test_fputc (int valeur, FILE * fp) 

{ 

int retour; 

retour = fputc(valeur, fp); 

fprintf (stdout, "\n Ecrit : %d, ", valeur); 

fprintf (stdout, "retour = %d ", retour); 
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if (retour == EOF) 

fprintf(stdout, "(EOF)"); 
fprintf (stdout, "\n"); 

} 

Voici le resultat de l'execution : 



$ . /exemple_fputc 




A 






Ecrit 


65, retour = 


65 


A 






Ecrit 


65, retour = 


65 


y 






Ecrit 


255, retour 


= 255 


y 






Ecrit 


-1, retour = 


255 


Ecrit 


65, retour = 


-1 (EOF 



$ 



Lors du premier appel, le caractere A est transforme en sa valeur Ascii entiere et est affiche 
normalement. Dans le second cas, la transformation avait ete effectuee manuellement aupara- 
vant, il n'y a done pas de difference. Dans le troisieme appel, la valeur UCHAFLMAX vaut 255, 
qui se traduit dans la table de caracteres ISO 8859-1 par ce curieux y avec un trema 1 . 

Dans le quatrieme exemple, nous voyons que la valeur entiere signee -1 est traduite en son 
equivalent en caractere non signe, e'est-a-dire UCHAFLMAX, qui est affiche egalement. Nous 
notons ici que la valeur de retour de fputc( ) est 255, e'est-a-dire la valeur en caractere non 
signe retransformee en int. Nous observons alors une chose importante : toutes les valeurs 
que fputc( ) renvoie, lorsqu'il reussit, sont comprises entre 0 et UCHAFLMAX. 

Dans le dernier exemple, nous demandons a fputc( ) d'ecrire dans le flux stdin qui est exclu- 
sivement ouvert en lecture. La fonction echoue done. Mais par contre, elle nous renvoie -1, 
qui est la valeur attribuee a la constante symbolique EOF dans <stdi o . h>. Comme nous avons 
observe qu'en cas de reussite la valeur renvoyee est toujours comprise entre 0 et 255, il n'y a 
pas d'ambiguite possible. Nous retrouverons ce comportement dans la fonction de lecture 
d'un caractere, qui renvoie aussi une valeur negative en cas d'echec. 

La seconde fonction de sortie de caractere, putc( ) , correspond au prototype suivant : 

int putc (int valeur, FILE * stream); 

Elle se comporte exactement comme fputcO, mais peut etre implemented sous forme de 
macro. Elle est done optimisee, mais peut evaluer plusieurs fois ses arguments. On l'utilisera 
done de preference a fputcO, mais en faisant attention a ne pas placer en argument des 
expressions ayant des effets de bord, comme putcUabl e[i++] ). 

Lorsque la sortie se fait sur le flux stdout, on peut utiliser la fonction putchar( ) 
| int putchar (int valeur); 



1. Cette lettre existe bien en francais, mais uniquement dans des noms propres, par exemple Pierre Louys ou L'Hay-les- 
roses. On trouvera une interessante reflexion a ce propos dans [Andre 1996]. 



Entrees-sorties simplifies 




Chapitre 10 



qui est equivalente a putctval eur , stdout), sans avoir besoin d'evaluer le second argument, 
et qui est done encore mieux optimisee. 

Lorsqu'on desire ecrire une chaine de caracteres complete, on utilise la fonction fputsO, 
declaree ainsi : 



Cette fonction envoie dans le flux mentionne la chaine de caracteres transmise, sans le carac- 
tere nul \0 final et sans ajouter non plus de retour a la ligne. 

exemplejputsx : 

#include <stdio.h> 
#include <stdlib.h> 

int 

main (int argc, char * argv[]) 

{ 



fputsC'Pas d'argument \n", stdout); 
} else { 

fputst "Arguments : ", stdout); 
for (1=1; 1 < argc; i ++) 
f puts(argv[i ] , stdout); 
fputs("\n", stdout); 



Cet exemple montre que les arguments vont etre ecrits les uns a la suite des autres, sans sepa- 
ration : 

$ ./exemple_fputs 

Pas d'argument 

$ ./exemple_fputs aze rty uiop 

Arguments : azertyuiop 
$ 

Le comportement est assez semblable a celui de f pri ntf ( ), mais une confusion possible vient 
souvent du fait que 1' argument f 1 ux est le dernier et non plus le premier. 

Pour ecrire un message sur stdout, on peut utiliser la fonction puts( ) suivante : 

int puts (const char * message); 

Elle ecrit le message sur la sortie standard, sans le caractere nul final, mais en ajoutant auto- 
matiquement un retour a la ligne \n. En remplacant tous les f puts ( ... , stdout ) par puts ( . . . ) 
dans l'exemple precedent, on obtient l'execution suivante : 

$ ./exemple_puts aze rty uiop 

Arguments : 
aze 



int fputs (const char * s, FILE * fp); 



int 



1 ; 



return EXIT_SUCCESS; 



rty 
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uiop 



Nous y trouvons evidemment des retours a la ligne supplementaires car nous avons laisse tous 
les \n deja presents dans le code precedent. 

Saisie de caracteres 

Lorsqu'on desire lire un caractere depuis un flux, fgetc( ) fonctionne exactement a l'inverse 
de fputc( ). Cette fonction est declaree ainsi dans <stdio.h> : 

int fgetc (FILE * flux); 

Elle lit un unique caractere comme un unsi gned char et le renvoie une fois qu'il est converti 
en int. La valeur renvoyee est done comprise entre 0 et UCHAR_MAX. En cas d'echec, la valeur 
renvoyee est EOF. Cette constante symbolique est generalement definie comme egale a-1. 
Quoi qu'il en soit, cette constante n'est jamais situee dans l'intervalle 0 a UCHAFLMAX. II est 
done important de lire le resultat de fgetc ( ) dans une variable de type int et de le comparer 
avec EOF avant de le convertir en char si la lecture a reussi. 

exemplejgetc.c : 

#include <stdio.h> 
#include <stdlib.h> 

int 
main (void) 
{ 

int i ; 

while ((1 = fgetc(stdin)) != EOF) 

fprintf (stdout, " !£02X\n", i); 
return EXIT_SUCCESS; 

} 

Nous allons lire les donnees depuis le terminal. En voici un premier exemple : 

$ ./exemple_fgetc 

a 

61 
OA 

b 

62 
OA 

c 

63 
OA 

abc 

61 
62 
63 
OA 

$ 
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Nous voyons que le programme affiche d'abord la valeur correspondant au caractere a, suivie 
du retour a la ligne \n (OxOA). En effet, le terminal sous Linux n'envoie les donnees qu'apres 
la validation de toute la ligne avec la touche Entree. Nous en voyons un exemple lorsque la 
chaine a be est saisie en entier, puis validee avant que les donnees ne soient envoyees sur le 
flux st din du programme. 

Pour terminer le programme, il faut faire echouer la lecture en lui envoy ant le code EOF. Pour 
cela, on utilise la touche Controle-D. Ceci est configure a l'aide de la commande stty. On 
voit, a la fin de la deuxieme ligne d'affichage des resultats, que le caractere de controle eof est 
attribue a la touche Controle-D. 

$ stty -a 

speed 38400 baud; rows 25; columns 80; line = 0; 

intr = A C; quit = A \; erase = A ?; kill = A U; eof = A D; eol = <undef>; 
[...] 

$ 

Pour pouvoir lire directement les donnees sans attendre le retour chariot, il faut modifier le 
comportement du terminal. Nous en verrons une description detaillee dans le chapitre sur la 
gestion des terminaux. On peut quand meme agir au niveau du shell pour modifier le mode de 
lecture du terminal : 

$ stty -1 canon 
$ ./exemple_fgetc 
a 61 

z 7A 
e 65 
A D 04 

$ stty sane 
$ 

La commande stty -i canon modifie la gestion du terminal. La fonction f getc( ) permet alors 
de lire immediatement les caracteres, sans attendre leur validation par la touche Entree. Par 
contre, la touche Controle-D ne fait plus echouer la lecture, elle renvoie simplement le code 
normal de la touche. On arrete le programme en utilisant Controle-C, qui envoie le signal 
SIGINT. La commande stty sane permet de retablir le terminal dans un etat normal. 

Nous reviendrons dans le chapitre consacre a la gestion des terminaux sur le moyen de modi- 
fier la configuration du terminal directement depuis F application, et d'utiliser des lectures 
non bloquantes pour capturer des caracteres au vol, afin que l'application puisse continuer a 
s'executer meme si l'utilisateur n'a pas appuye sur des touches. 

On peut employer egalement getc( ), qui est fonctionnellement equivalente a f getc( ), mais 
qui peut etre implementee sous forme de macro, evaluant plusieurs fois son argument f 1 ux. 

Enfin, la routine getcharO est equivalente a getc(stdin). Nous allons F employer pour ecrire 
une application qui affiche le contenu de son entree standard en hexadecimal et sous forme 
de caracteres. Ce genre d'utilitaire est souvent employe pour le debogage, pour analyser le 
contenu de fichiers de donnees binaires. 

exemple_getchar.c : 

#include <stdio.h> 
^include <stdlib.h> 
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//include <ctype.h> 

int 
main (void) 
{ 

int lu; 

char caracteres[17] ; 
int emplacement = 0; 
int rang = 0; 

caracteres[16] = '\0' ; 

while ((lu = getcharO) != EOF) { 

if ((rang = emplacement % 16) == 0) 

fprintf(stdout, "%08X ", emplacement % OxFFFFFFFF); 
fprintf(stdout, "%02X" , lu); 
if (rang == 7) 

fprintf (stdout, "-"); 

el se 

fprintf (stdout, " "); 
if (isprintd u) ) 

caracteres[rang] = lu; 

el se 

caracteres[rang] = ' ' ; 
if (rang == 15) 

fprintf (stdout, " %s\n", caracteres); 
emplacement ++; 

} 

while (rang < 15) { 

fprintf (stdout, " "); 
caracteres[rang] = '\0'; 
rang ++; 

} 

fprintf (stdout, " £s\n", caracteres); 
return EXIT_SUCCESS; 

} 

Ce genre de programme peut etre utilise tant sur des fichiers binaires que sur des fichiers de 
texte : 



$ ./exemple_getchar < exemple_getchar.c 



00000000 


OA 


09 


23 


69 


6E 


63 


6C 


75- 


64 


65 


20 


3C 


73 


74 


64 


69 


#include <stdi 


00000010 


6F 


2E 


68 


3E 


OA 


09 


23 


69- 


6E 


63 


6C 


75 


64 


65 


20 


3C 


o.h> #include < 


00000020 


63 


74 


79 


70 


65 


2E 


68 


3E- 


OA 


OA 


09 


69 


6E 


74 


OA 


6D 


ctype.h> int m 


00000030 


61 


69 


6E 


20 


28 


76 


6F 


69- 


64 


29 


OA 


7B 


OA 


09 


69 


6E 


ain (void) { in 


00000040 


74 


09 


6C 


75 


3B 


OA 


09 


63- 


68 


61 


72 


09 


63 


61 


72 


61 


t lu; char cara 


[...] 

00000280 


20 


2B 


2B 


3B 


OA 


09 


7D 


0A- 


09 


66 


70 


72 


69 


6E 


74 


66 


++; ) fprintf 


00000290 


20 


28 


73 


74 


64 


6F 


75 


74- 


2C 


20 


22 


20 


25 


73 


5C 


6E 


(stdout, " %s\n 


000002A0 


22 


2C 


20 


63 


61 


72 


61 


63- 


74 


65 


72 


65 


73 


29 


3B 


OA 


", caracteres); 


000002B0 


09 


72 


65 


74 


75 


72 


6E 


20- 


45 


58 


49 


54 


5F 


53 


55 


43 


return EXIT_SUC 


000002C0 


43 


4E 


53 


53 


3B 


OA 


7D 


0A 


















CESS; } 
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$ . /exemple_getchar < exemple_getchar 



00000000 7F 45 4C 46 01 01 01 00-00 00 00 00 00 00 00 00 

00000010 02 00 03 00 01 00 00 00-A0 83 04 08 34 00 00 00 

00000020 60 24 00 00 00 00 00 00-34 00 20 00 06 00 28 00 

00000030 IE 00 IB 00 06 00 00 00-34 00 00 00 34 80 04 08 

00000040 34 80 04 08 CO 00 00 00-C0 00 00 00 05 00 00 00 
[...] 



4 



ELF 



4 
4 



4 



4 



00003020 79 70 65 5F 62 40 40 47-4C 49 42 43 5F 32 2E 30 

00003030 00 5F 49 4F 5F 73 74 64-69 6E 5F 75 73 65 64 00 

00003040 5F 5F 64 61 74 61 5F 73-74 61 72 74 00 5F 5F 67 

00003050 6D 6F 6E 5F 73 74 61 72-74 5F 5F 00 



ype_b@@GLIBC_2.0 
_10_stdin_used 
data_start g 



mon_start. 



$ 



Nous avons bien entendu elimine de nombreuses lignes pour presenter les resultats du 
programme. Nous reutiliserons cet utilitaire a plusieurs reprises dans le reste de cet ouvrage 
pour analyser les effets d'autres programmes d'exemple. 



II peut arriver qu'on veuille en quelque sorte annuler la lecture d'un caractere. Imaginons une 
routine qui doit lire des caracteres uniquement numeriques et qui s'arrete des qu'elle 
rencontre un caractere ne se trouvant pas dans Fintervalle '0' - '9'. La suite du traitement sera 
prise en charge par une autre routine, qui agira en fonction du nouveau caractere lu. Une des 
eventualites serait de toujours conserver le caractere lu dans une variable globale, la lecture 
ayant toujours un caractere d'avance sur le traitement proprement dit. C'est d'ailleurs la 
methode generalement employee par les analyseurs lexicaux, qui fonctionnent avec des mots 
complets (token). 

Une autre possibility serait de replacer dans le flux d'entree le dernier caractere lu, pour que 
la prochaine lecture le renvoie a nouveau. Comme les flux fonctionnent en utilisant des 
memoires tampons, il ne s'agit pas d'une veritable ecriture dans le fichier associe, mais 
simplement d'un ajout en tete de buffer. La routine assurant cette tache est ungetc( ), declaree 
ainsi dans <stdi o . h> : 

int ungetc (int caractere_lu, FILE * flux); 

Cette routine replace le caractere transmis dans le flux. Le premier argument est de type int, 
car on peut egalement lui transmettre la constante symbolique EOF. Cela permet au besoin de 
transmettre directement a ungetc ( ) le resultat de fgetc( ). II n'est possible de replacer dans le 
flux qu'un seul caractere, et il est inutile d'invoquer plusieurs fois de suite ungetcO. Le 
comportement est indefini pour ce qui est de savoir si le dernier caractere transmis ecrasera 
les precedents. Notons egalement que le caractere qu'on replace dans le flux n'est pas neces- 
sairement celui qu'on vient de lire. 

L'exemple que nous allons construire est un peu artificiel : deux routines sont chargees de lire 
caractere par caractere l'entree standard. L'une s'occupe des caracteres numeriques, l'autre 
des caracteres alphabetiques. La routine tnain( ) centrale lit un caractere puis, s'il correspond 
a l'une des deux classes de caracteres definies ci-dessus, elle reinjecte le caractere lu dans le 
flux d'entree, et invoque la routine specialised correspondante. Ces routines sont construites 
de maniere a lire tout ce qui arrive puis, des qu'un caractere ne leur convient pas, elles le 
replacent dans le flux, et reviennent a la fonction main( ). 



Reinjection de caractere 



248 



Programmation systeme en C sous Linux 



exemple_ungetc.c : 

//include <ctype.h> 
//include <stdio.h> 

void lecture_numerique (FILE * fp); 
void 1 ecture_al phabetique (FILE * fp); 

int 
n (void) 

int c; 

while ((c = getc(stdin)) != EOF) { 
if (isdigit(c)) { 
ungetc(c, stdin); 
lecture_numeri que (stdin) ; 
} else if (isalpha(c)) { 
ungetc(c, stdin); 
lecture_alphabetique(stdin) ; 

} 

} 

return EXIT_SUCCESS; 

} 

void 

1 ecture_numerique (FILE * fp) 
{ 

int c; 

fprintf (stdout, "Lecture numerique : "); 
while (1) { 

c = getc(fp) ; 
if (! isdigit(c)) 
break; 

fprintf (stdout, "%c" , c); 

} 

ungetc(c, fp); 
fprintf (stdout, "\n"); 



void 

lecture_alphabetique (FILE * fp) 
{ 

int c; 

fprintf (stdout, "Lecture alphabetique : "); 
while (1) { 

c = getc(fp) ; 

if (! isalpha(c)) 
break; 

fprintf (stdout, "%c" , c); 

} 

ungetc(c, fp); 
fprintf (stdout, "\n"); 
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Voici un exemple d'execution : 

$ ./exemple_ungetc 

AZE123 ABCDEF9875XYZ 
Lecture alphabetique : AZE 
Lecture numerique : 123 
Lecture alphabetique : ABCDEF 
Lecture numerique : 9875 
Lecture alphabetique : XYZ 
$ 

Saisie de chaTnes de caracteres 

Pour lire une chaine de caracteres, il existe deux fonctions : gets( ) et fgetst ). Le prototype 
de gets( ) est le suivant : 

char * gets (char * buffer); 

Cette fonction lit l'entree standard stdi n et place les caracteres dans la chaine passee en argu- 
ment. Lorsqu'elle rencontre le caractere EOF ou un retour chariot, elle les remplace par le 
caractere nul de fin de chame '\0', et renvoie le pointeur sur la chaine. Si le caractere EOF est 
rencontre avant qu'elle ait pu lire un seul caractere, gets( ) renvoie le pointeur NULL. 



Attention 

II ne faut jamais utiliser gets ( ) 



En effet, getsO ne permet pas de preciser la longueur maximale de la chaine a saisir. En 
consequence, si le nombre de caracteres recus excede la taille de la zone qu'on a allouee, 
gets ( ) continuera joyeusement a ecrire en memoire en provoquant un debordement de buffer. 

gets( ) servant generalement a lire une chaine de caracteres tapee au clavier par l'utilisateur, 
on pourrait croire qu'allouer un buffer suffisamment grand eviterait tout probleme. Malheu- 
reusement, il suffit de rediriger 1' entree standard du processus en provenance d'un fichier 
pour que la saisie puisse prendre n'importe quelle longueur. 

Dans le meilleur des cas, le programme ira ecrire en dehors de son espace d'adressage auto- 
rise par le noyau et sera alors termine par un signal SIGSEGV. Mais un grave probleme de secu- 
rite peut aussi survenir si le programme est installe avec un bit Set-UID ou Set-GID. En C, les 
donnees automatiques des fonctions (celles qui ne sont pas declarees statiques) sont allouees 
dans la pile. Lors de l'entree dans une fonction, l'adresse de retour et les arguments sont 
empiles. Ensuite, on reserve dans la pile la place necessaire aux variables automatiques. Par 
exemple, lors de l'entree dans la routine suivante 

int 

fonction (int x) 
{ 

int xl; 

char chaine_l[128]; 

} 
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on stocke successivement sur la pile F argument x, l'adresse de retour, puis on reserve 4 octets 
pour xl, et 128 octets pour la chaine. Sous Linux X86, la pile croit vers le bas, signifiant que 
l'adresse de chaine_l[0] est plus petite que celle de xl, qui est elle-meme inferieure a 
l'adresse de retour et a l'adresse de x. Voici un exemple pour clarifier la situation : 

exemple_pile.c : 

#include <stdio.h> 

int fonction (int x); 

int 
main (void) 
{ 

return fonction(l); 

} 

int 

fonction (int x) 
f 

int xl; 

char chaine[128] ; 

fprintf (stdout, "& x = %p lg 
fprintf (stdout, "& xl = %p lg 
fprintf (stdout, "chaine = %p lg 
if (x > 0) 

return fonctiontx - 1) ; 
return EXIT_SUCCESS ; 

} 

La fonction s'appelle elle-meme une fois, pour pouvoir deduire la position de l'adresse de 
retour par rapport a F argument. Lors de F execution, nous obtenons ceci : 

$ ./exemple_pile 

& x = 0xbffffcf4 lg = 4 

& xl = 0xbffffce8 lg = 4 

chaine = 0xbffffc68 lg = 128 

& x = 0xbffffc64 lg = 4 

& xl = 0xbffffc58 lg = 4 

chaine = 0xbffffbd8 lg = 128 
$ 

II est clair que lors de la deuxieme invocation de fonctiont ), la pile est structuree ainsi : 



Adresse debut 


Adresse fin 


Taille 


Contenu 


0xBFFFFCF4 


0xBFFFFCF7 


4 


Argument x (valant 1) 


OxBFFFFCEC 


0xBFFFFCF3 


8 


Adresse de retour 


0xBFFFFCE8 


OxBFFFFCEB 


4 


Variable automatique xl 


0xBFFFFC68 


0xBFFFFCE7 


128 


Variable automatique chaine[] 


0xBFFFFC64 


0xBFFFFC67 


4 


Second argument x (valant 0) 



= %d\n", & x, sizeof(x)); 

= %d\n". & xl, sizeof(xl)); 

= %d\n", chaine, sizeof(chaine)); 
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Adresse debut 


Adresse fin 


Taille 


Contenu 


0xBFFFFC5C 


0xBFFFFC63 


8 


Seoonde adresse de retour 


0xBFFFFC58 


0xBFFFFC5B 


4 


Seconde variable automatique xl 


0xBFFFFBD8 


0xBFFFFC57 


128 


Seconde variable automatique chaine[] 



Si, lors d'une lecture avec gets( ) , nous debordons de la chaine allouee dans la pile, nous 
allons ecraser d'abord xl - ce qui n'est pas tres grave -, mais egalement l'adresse de retour. 
Lorsque la fonction va se terminer, le programme va essayer de revenir a une adresse erronee 
et va avoir un comportement incoherent, difficile a deboguer. 

Si le programme est Set-UID, la situation est encore pire car un pirate peut l'exploiter en 
faisant volontairement deborder la chaine (en fournissant des donnees depuis un fichier 
binaire). II s'arrangera pour glisser du code valide dans la pile et fera pointer l'adresse de 
retour sur ce code. Le programme Set-UID executera alors exactement ce que veut son utili- 
sateur mais avec l'identite du proprietaire du fichier executable. Obtenir un shell root est alors 
tres simple. On comprend mieux a present l'interet de limiter les privileges d'une application 
Set-UID en diminuant son ensemble de capacites. 

Une grande partie des failles de securite decouvertes dans les programmes Set-UID sont dues 
a ce genre de problemes. II ne faut done jamais utiliser gets( ). D'ailleurs, l'editeur de lien 
Gnu « 1 d » signale aussi qu'il ne faut pas utiliser cette fonction. 

exemple_gets.c : 

#include <stdio.h> 

int 
main (void) 

{ 

char chaine[128]; 

return (gets(chaine) != NULL); 

} 

Lors de la compilation, on obtient le message suivant : 

$ cc -Wall exemple_gets.c -o exemple_gets 

/tmp/cc5S26rd.o: In function 'main': 

/tmp/cc5S26rd.o( .text+Oxe) : the 'gets' function is dangerous and should not be 

used. 

$ 

Au contraire, fgets( ) est bien plus robuste puisqu'elle permet de limiter la taille de la saisie. 
Son prototype est le suivant : 

char * fgets (char * chaine, int taille, FILE * flux); 

Cette fonction lit les caracteres sur le flux indique et les place dans la chaine transmise en 
argument. En aucun cas, elle ne depassera tai 11 e-1 caracteres lus. Elle s'arretera egalement 
si elle rencontre un caractere de retour a la ligne '\n' ou une fin de fichier EOF. Le caractere 
'\n' eventuel est ecrit dans le buffer. Ensuite, fgets ( ) termine la chaine par un caractere nul. 
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Cette routine renvoie le pointeur sur la chaine passee en argument lorsqu'elle reussit. Au 
contraire, si elle a rencontre le caractere EOF avant d' avoir pu lire quoi que ce soit, elle renvoie 
un pointeur NULL. Si on desire lire une ligne en entier, quelle que soit sa longueur, il est 
possible d'ecrire une routine qui encadre fgets( ) et qui alloue de la memoire jusqu'a la fin 
de la ligne. II s'agit du meme genre de fonctionnalite que celle que nous avions creee pour 
printf ( ). 

exemplejgets.c : 

#include <stdio.h> 
#include <stdlib.h> 
#1nclude <string.h> 

char * alloc_fgets (FILE * fp); 

int 
main (void) 
{ 

char * chaine; 

while (1) { 

chaine = alloc_fgets(stdin) ; 
if (chaine == NULL) 

/* Pas assez de memoire */ 
break; 

if ((chaine[0] == '\n') || (chaine[0] == '\0')) 
/* Chaine vide... on quitte */ 
break; 

fprintf (stdout, "%d caracteres \n", strlen(chaine)); 
f ree(chaine) ; 

} 

return EXIT_SUCCESS; 

} 

char * 
alloc_fgets (FILE * fp) 
{ 

char * retour = NULL; 
char * a_ecrire = NULL; 
int taille = 64; 

retour = mal 1 oc(tai 1 1 e) ; 
a_ecrire = retour; 

while (1) { 

if (fgets(a_ecrire, 64, fp) == NULL) 
break; 

if (strlen(a_ecrire) < 63) 
break; 

/* On se place sur le caractere nul final */ 
a_ecrire = a_ecrire + 63; 
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/* Et on agrandit egalement le buffer de 63 caracteres */ 
taille += 63; 

retour = realloctretour, taille); 
if (retour == NULL) 



break; 



} 

return retour; 

} 

Le programme lit des chaines de caracteres et en affiche la longueur jusqu' a ce qu'il recoive 
une chaine vide, puis il se termine. 

$ ./exemple_fgets 

ABCDEFGHIJKLMNOPQRSTUVWXYZ 
27 caracteres 

ABCDEFGHIJKLMN0PQRSTUVWXYZabcdefghijklmnopqrstuvwxyzl2345678901234567890 

73 caracteres 

ABC 

4 caracteres 



On remarquera que dans les longueurs affichees, le caractere de retour a la ligne induit par la 
touche de validation Entree est comptabilise. On voit bien qu'avec la chaine de 73 caracteres, 
la saisie a effectue l'allocation en deux etapes et a bien renvoye tous les caracteres (26 lettres 
+ 26 lettres + 20 chiffres + retour chariot = 73). 

La bibliotheque GlibC offre une routine assez semblable, mais qui a l'inconvenient d'etre une 
extension Gnu, done de ne pas etre disponible sur d'autres systemes. II est quand meme 
conseille de s'en servir, et on pourra toujours la redefinir en utilisant la meme methode que 
pour notre exemple precedent si le programme doit etre porte sur un systeme different. Cette 
routine est nommee getl 1 ne( ), et elle est declaree ainsi dans <stdi o . h> : 

ssize_t getline (char ** chaine, size_t * taille, FILE * flux); 

Son utilisation est legerement moins intuitive, puisqu'elle prend en argument un pointeur sur 
un pointeur de chaine de caracteres et un pointeur sur une valeur de longueur. Elle tente tout 
d'abord d'effectuer la lecture dans la chaine existante, qui doit avoir (*tai lie) octets au 
moins. Si cela suffit, elle renvoie le nombre de caracteres lus, sans compter le caractere nul 
final qu'elle ajoute. Sinon, elle realloue de la memoire, en modifiant le pointeur chaine et la 
taille, jusqu' a ce que la ligne lue tienne en entier dans la chaine. On peut egalement l'invoquer 
avec un pointeur *chaine valant NULL, et *tai 1 1 e valant zero, elle assurera l'allocation initiale. 

La fin de la ligne est determined par EOF ou par le retour chariot. Si EOF arrive des le debut de 
la lecture ou si une autre erreur se produit, getlineO renvoie -1 (ce qui explique le type 
ssi ze_t de la fonction, e'est-a-dire signed size_t). 

L'avantage de cette routine e'est qu'elle renvoie le nombre de caracteres lus. Dans la routine 
que nous avions ecrite, ce nombre ne pouvait etre defini qu'a l'aide de strl en( ). Malheureu- 
sement, si la chaine lue contient un caractere nul, strlent ) s'arretera a ce niveau. Cela peut 
parfois poser des problemes lors de la redirection d'un fichier binaire en entree. 



$ 



254 



Programmation systeme en C sous Linux 



Voyons un exemple d' utilisation de getl ine( ), dans le meme genre que le precedent : 
exemple_getline.c : 

//define _GNU_SOURCE 

//include <stdio.h> 
//include <stdlib.h> 
//include <string.h> 

int 
main (void) 
{ 

char * chaine; 
size_t taille; 
ssize_t retour; 

while (1) { 
taille = 0; 
chaine = NULL; 

retour = getline(& chaine, & taille, stdin); 
if (retour == -1) 
break; 

fprintf (stdout, "%d caracteres lus\n", retour); 
fprintf (stdout, "%d caracteres alloues \n", taille); 
f ree(chaine) ; 

} 

return EXIT_SUCCESS; 

} 

Lors de l'execution, on arrete le programme en tapant directement sur Controle-D (EOF) en 
debut de ligne pour provoquer un echec. Nous affichons egalement la taille du buffer alloue 
par la routine, afin de pouvoir le depasser volontairement lors de la seconde saisie. 

$ ./exemple_getline 

ABCDEFGH IJKLMNOPQRSTUVWXYZ 

27 caracteres lus 

120 caracteres alloues 

ABCDEFGH I J KLMNOPQRSTUVWXYZABCDEFGH I J KLMNOPQRSTUVWXYZABCDEFGH IJKLMNOPQRSTUVWXYZ 

ABCDEFGH I J KLMNOPQRSTUVWXYZABCDEFGH I J KLMNOPQRSTUVWXYZABCDEFGH IJKLMNOPQRSTUVWXYZ 
157 caracteres lus 
240 caracteres alloues 
$ 

Nous avons vu comment lire des caracteres ou des chaines. Nous allons a present nous 
interesser a la maniere de recevoir des informations correspondant a d'autres types de 
donnees. 
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Lectures formatees depuis un flux 

La saisie formatee de donnees se fait avec les fonctions de la famille scanf ( ). Comme pour la 
famille printf ( ), il existe six versions ayant les prototypes suivants : 

int scanf (const char * format, ...); 

int vscanf (const char * format, va_list arguments); 

int fscanf (FILE * flux, const char * format, ...); 

int vfscanf (FILE * flux, const char * format, va_list arguments); 

int sscanf (const char * chaine, const char * format, ...) 

int vsscanf (const char * chaine, const char * format, va_list args); 

Pareillement, il existe en fait trois types de fonctions, chacune disponible en deux versions, 
avec un nombre variable d' arguments ou avec une table d' arguments. Ce dernier type neces- 
site l'inclusion du fichier d'en-tete <stdarg.h>. 

• scanf ( ) et vscanf ( ) lisent les donnees en provenance de stdi n. 

• fscanf () et vf scanf () analysent les informations provenant du flux qu'on transmet en 
premier argument. 

• sscanf ( ) et vsscanf ( ) effectuent la lecture formatee depuis la chaine de caracteres trans- 
mise en premier argument. 

L' argument de format se presente comme une chaine de caracteres semblable a celle qui est 
employee avec printf ( ), mais avec quelques differences subtiles. 

Les arguments fournis ensuite sont des pointeurs sur les variables qu'on desire remplir. Les 
fonctions renvoient le nombre de variables qu'elles ont reussi a remplir correctement. 

Contrairement a printfO, qui est assez tolerante avec le formatage demande puisqu'elle 
assure de toute maniere une conversion de type, il faut indiquer ici, dans la chaine de format, 
le bon type de donnee correspondant au pointeur a remplir. Si on demande par exemple a 
scanf ( ) de lire un reel doubl e et qu'on lui transmette un pointeur sur un char, le compilateur 
fournira un avertissement, mais rien de plus. Lors de F execution du programme, Fecriture 
debordera de la place memoire reservee au caractere. 

Voici un exemple de programme qui plante a coup sur. Le caractere c etant alloue comme une 
variable automatique de la fonction mainO, lorsqu'on l'ecrase avec une ecriture de type 
double, on detruit la pile, y compris l'adresse de retour de main( ) qui est, ne l'oublions pas, 
une fonction comme les autres avec la simple particularite d'etre automatiquement invoquee 
par le chargeur de programme. 

exemple_scanf_1.c : 

#include <stdio.h> 



int 
main (void) 
{ 

char c; 

putsC'Je vais me planter des que vous aurez entre un chiffre \n"); 
return ( scanf ( "%1 f" , & c) == 1); 

} 
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Et voici le resultat, dont il n'y a pas lieu d'etre fier. . . 

$ cc -Wall exemple_scanf_l.c -o exemple_scanf_l 

exemple_scanf_l.c: In function "main': 

exemple_scanf_l.c:ll: warning: double format, different type arg (arg 2) 
$ ./exemple_scanf_l 

Je vais me planter des que vous aurez entre un chiffre 
12 

Segmentation fault (core dumped) 

$ rm core 

$ 

Voyons done a present quels sont les bons indicateurs a fournir dans la chame de format, en 
correspondance avec le type de donnee a utiliser. 





Type 


Format 


char 




%c 


char * 




%s 


short int 




%hd Jhi 


unsigned short int 




%du %Ao %dx til 


int 




U Hi 


unsigned int 




%u la %x U 


long int 




«ld %li 


unsigned long int 




Xlu %^o 11x %1X 


long long int 




XI Id ILd %1 1 i %Li 


unsigned long long 


i nt 


%1 1 u ZLu %1 1 o %Lo %llx %ix %11X %LX 


float 




le %f %g 


doubl e 




%le %lf %1 g 


long double 




«lle lie %llf ^Lf %1 1 g %lg 


void * 




%p 



Nous voyons qu'il y a en definitive quelques indicateurs principaux et des modificateurs de 
type. Les indicateurs generaux sont : 



Indicateur 


Type 


d 


Valeur entiere signee sous forme decimale 


i Valeur entiere signee exprimee comme les constantes en C 
(avec un prefixe 0 pour I'octal, Ox pour I'hexadecimal...) 


u 


Valeur entiere non signee sous forme decimale 


0 


Valeur entiere non signee en octal 


x ou X 


Valeur entiere non signee en hexadecimal 


e, f ou g 


Valeur reelle 


s 


Chaine de caracteres sans espace 


c 




Un ou plusieurs caracteres 
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A ceci s'ajoutent les modificateurs h pour short, 1 pour 1 ong (dans le cas des entiers) ou pour 
doubl e (dans le cas des reels), et 1 1 ou L pour 1 ong 1 ong ou pour 1 ong doubl e. II existe egale- 
ment des conversions %C et %S pour les caracteres larges, nous arborderons ce sujet dans le 
chapitre 23. 

Notons qu'on peut inserer entre le caractere % et l'indicateur de conversion une valeur nume- 
rique representant la taille maximale a accorder a ce champ. Ce detail est precieux avec la 
conversion %s pour eviter un debordement de chaine. II est egalement possible de faire 
preceder cette longueur d'un caractere 'a', qui demandera a scanf ( Jd'allouer automatique- 
ment la memoire necessaire pour la chaine de caracteres a lire. Cela n'a de sens qu'avec une 
conversion de type %s. Dans ce dernier cas, il faut transmettre un pointeur de type char **. 

L'indicateur de conversion 'c' est precede d'une valeur numerique : il indique le nombre 
de caracteres qu'on desire lire. Par defaut, on lit un seul caractere, mais il est ainsi possible de 
lire des chaines de taille quelconque. Contrairement a la conversion s, la lecture ne s'arrete 
pas au premier caractere blanc. On peut ainsi lire des chaines contenant n'importe quel carac- 
tere d'espacement. Par contre, scanf ( ) n'ajoute pas de caractere nul a la fin de la chaine, il 
faut le placer soi-meme. 

Lorsqu'un caractere non blanc est present dans la chaine de format, il doit etre mis en corres- 
pondance avec la chaine recue depuis le flux de lecture. Cela permet d' analyser facilement 
des donnees provenant d'autres programmes, si le format d'affichage est bien connu. En voici 
un exemple : 

exemple_scanf_2.c : 

#include <stdio.h> 
#include <stdlib.h> 



int 
main (void) 

{ 

int i , j , k; 



if (fscanf(stdin, "i = %d j = %d k = %d\ & i , & j , & k) == 3) 
fprintf (stdout, "Ok (%d, %d, %d)\n" , i, j, k); 

else 

fprintf (stdout, "Erreur \n"); 
return EX IT_SUCCESS ; 

} 

Ce programme reussit lorsqu'on lui fournit une ligne construite sur le modele prevu, mais il 
echoue sinon : 

$ ./exemple_scanf_2 

1=1 j=2 k=3 

Ok (1, 2, 3) 

$ ./exemple_scanf_2 

i = 4 j = 5 k = 006 

Ok (4, 5, 6) 

$ ./exemple_scanf_2 

45 67 89 

Erreur 

$ 
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Ici, les caracteres blancs dans la chaine de format servent a eliminer tous les caracteres blancs 
eventuels presents dans la ligne lue. Les concepteurs de la bibliotheque stdio devaient etre 
d'humeurparticulierement facetieuse le jour oil ils ont defini le comportement de scanf ( ) vis- 
a-vis des caracteres blancs et de la gestion d'erreur. En effet, lorsque scanf ( ) recoit un carac- 
tere qu'elle n' arrive pas a mettre en correspondance avec sa chaine de format, elle le reinjecte 
dans le flux de lecture avec la fonction ungetc( ). Ceci se produit par exemple lorsqu'on attend 
un caractere particulier et qu'un autre arrive, ou lorsqu'on attend un entier et qu'on recoit un 
caractere alphabetique. De nombreux debutants en langage C se sont arraches les cheveux sur 
le comportement a priori incomprehensible de programmes comme celui-ci. 

exemple_scanf_3.c : 

#include <stdio.h> 
#include <stdlib.h> 

int 
main (void) 
{ 

int i ; 

fprintf (stdout, "Veuillez entrer un entier : "); 
while (1) { 

if (scanf("%d\ & i) == 1) 
break; 

fprintf (stdout, "\nErreur, un entier svp :"); 

} 

fprintf (stdout, "\nOk\n"); 
return EXIT_SUCCESS ; 

} 

La saisie se passe tres bien tant que Futilisateur ne commet pas d'erreur : 

$ . /exemple_scanf_3 

Veuillez entrer un entier : 4767 

Ok 
$ 

Par contre, si on entre un caractere alphabetique a la place d'un chiffre, scanf ( ) le refuse, le 
reinjecte dans le flux et indique qu'elle n'a pu faire aucune conversion. Toute notre belle 
gestion d'erreur s'effondre alors, car a la tentative suivante nous allons relire a nouveau le 
meme caractere errone ! Cela se traduit alors par une avalanche de messages d'erreur que seul 
un Controle-C peut interrompre : 

$ . /exemple_scanf_3 

Veuillez entrer un entier : A 

Erreur, un entier svp : 

Erreur, un entier svp : 

Erreur, un entier svp : 

Erreur, un entier svp : 

Erreur, un entier svp : 

Erreur, un entier svp : 
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Erreur, un entier svp : 
Erreur, un entier svp : 
[...] 

Erreur, un entier svp : 

Erreur, un entier svp : 

Erreur, un entier svp : 

Erreur, un entier svp : 

Erreur, un en (Controle-C) 

$ 

Le seul moyen simple de gerer ce genre de probleme est de passer par une etape de saisie 
intermediate de ligne, a l'aide de la fonction fgets( ). 

exemple_scanf_4.c : 

#include <stdio.h> 
#include <stdlib.h> 

int 
main (void) 

{ 

char ligne[128]; 
int i ; 

fprintf (stdout, "Veuillez entrer un entier : "); 
while (1) { 

if (fgetsdigne, 128, stdin) == NULL) { 

fprintf (stderr, "Fin de fichier inattendue \n"); 
return EXIT_FAI LURE ; 

} 

if (sscanfdigne, "%d" , & i) == 1) 
break; 

fprintf (stdout, "\nErreur, un entier svp : "); 

} 

fprintf (stdout, "Ok\n"); 
return EXIT_SUCCESS; 

} 

Cette fois-ci, le comportement est celui qu'on attend : 

$ ./exemple_scanf_4 

Veuillez entrer un entier : 12 
Ok 

$ ./exemple_scanf_4 

Veuillez entrer un entier : A 

Erreur, un entier svp : Z 
Erreur, un entier svp : E 



Erreur, un entier svp : 24 

Ok 

$ 
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L' autre piege classique de scanfO c'est qu'un caractere blanc dans la chame de format 
elimine tous les caracteres blancs presents dans le flux en lecture. Lorsqu'on parle de carac- 
teres blancs, il s'agit de l'espace et de la tabulation bien sur, mais egalement des retours a la 
ligne. En fait, il s'agit des caracteres correspondant a la fonction i sspace( ) que nous verrons 
dans le chapitre 23, c'est-a-dire l'espace, les tabulations verticales et horizontales '\t' et '\v', 
le saut de ligne '\n', le retour chariot '\r', et le saut de page '\f '. 

Cela a des consequences inattendues sur un programme aussi simple que celui-ci. 
exemple_scanf 5.c : 

#include <stdio.h> 
#include <stdlib.h> 

int 
main (void) 
{ 

int i ; 

fprintf (stdout, "Entrez un entier : "); 
if (scanf("%d\ & i) == 1) 

fprintf (stdout, "Ok i=%d\n", i); 

el se 

fprintf (stdout, "Erreur \n"); 
return EXIT_SUCCESS; 

} 

Tout se passe correctement avec ce programme : 

$ ./exemple_scanf_5 

Entrez un entier : 12 
Ok 1=12 

$ ./exemple_scanf_5 

Entrez un entier : A 

Erreur 

$ 

Par contre, supposons qu'on introduise un caractere blanc supplementaire a la fin de la chaine 
de format. Par exemple, on pourrait en croyant bien faire y ajouter un retour a la ligne '\n' 
pour marquer la fin de la saisie. La ligne de scanf ( ) deviendrait : 

if (scanf ("%d\n", & i) == 1) 

Mais le comportement serait particulierement surprenant : 

$ ./exemple_scanf_6 

Entrez un entier : 12 



A 

Ok 1=12 
$ 
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Nous avons appuye trois fois sur la touche « Entree » a la suite de notre saisie, puis en deses- 
poir de cause, nous avons retape une lettre quelconque (A) suivie de Entree. Et c'est a ce 
moment seulement que notre saisie initiale a ete validee ! 

Pourtant ce fonctionnement est tout a fait normal. Comme nous avons mis un '\n' en fin de 
chaine de format - mais le resultat aurait ete le meme avec n'importe quel caractere blanc - 
scanfO elimine tous les caracteres blancs se trouvant a la suite de notre saisie decimale. 
Seulement, pour pouvoir eliminer tous les caracteres blancs, elle est obligee d'attendre d'en 
recevoir un qui ne soit pas blanc. Tout ceci explique rinefficacite de nos multiples pressions 
sur la touche Entree, et qu'il ait fallu attendre un caractere non blanc, en l'occurrence A, pour 
que scanf ( ) se termine. Notons que ce caractere non blanc est replace dans le flux pour la 
lecture suivante. 

Le comportement de scanf ( ) est parfois deroutant lorsqu'elle agit directement sur les flux. 
Pour cela, il est souvent preferable de faire la lecture ligne par ligne grace a fgets( ) ou a 
getl ine( ), et d' analyser ensuite le resultat avec sscanf ( ). Celle-ci aurait en effet, dans notre 
dernier exemple, rencontre la fin de la chaine, qu'elle aurait traitee comme un EOF, ce qui lui 
aurait permis d'arreter la recherche d'un caractere non blanc. En voici la preuve avec le 
programme suivant (le test d'erreur sur fgets( ) a ete supprime pour simplifier l'exemple). 

exemple_scanf_7.c : 

#include <stdio.h> 
#include <stdlib.h> 

int 
main (void) 

{ 

char ligne[128]; 
int i ; 

fprintf (stdout, "Entrez un entier : "); 
fgetsdigne, 128, stdin); 
if (sscanfdigne, "%d\n", & i) == 1) 
fprintf (stdout, "Ok i=M\n", i); 

else 

fprintf (stdout, "Erreur \n"); 
return EXIT_SUCCESS; 

} 



$ ./exemple_scanf_7 

Entrez un entier : 12 
Ok i =12 

$ . /exemple_scanf_7 

Entrez un entier : A 

Erreur 

$ 

Les fonctions de la famille scanf () offrent egalement quelques possibilites moins connues 
que nous allons voir rapidement. 
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• La saisie de l'adresse d'un pointeur, avec la directive %p : ceci ne doit etre utilise qu'avec 
une extreme precaution, le programme etant pret a capturer un signal SIGSEGV des qu'il va 
essayer de lire le contenu du pointeur si Futilisateur a fait une erreur. 

• La lecture d'un champ sans stockage dans une variable, en inserant un asterisque juste 
apres le caractere %. Le champ est purement et simplement ignore, sans stockage dans un 
pointeur ni incrementation du nombre de champs correctement lus. Ceci est surtout utilise 
pour ignorer des valeurs lors de la relecture de la sortie d' autre programme. Imaginons par 
exemple un programme de dessin vectoriel qui affiche les coordonnees X et Y de tous les 
points qu'il a en memoire. Lors d'une relecture de ces donnees, le numero du point ne 
presente pas d'interet, aussi prefere-t-on l'ignorer avec une lecture du genre : 

scanf (" point %*d : X = £lf Y = Elf", & x, & y). 

• La directive %n n'effectue pas de conversion mais stocke dans le pointeur correspondant, 
qui doit etre de type int *, le nombre de caracteres lus jusqu'a present. Cela peut servir 
dans l'analyse d'une chaine contenant plusieurs champs. Supposons par exemple que le 
premier champ indique de maniere numerique le type du champ suivant (0 = entier, 
1 = reel). II est alors commode de stocker la position atteinte apres cette premiere lecture, 
pour reprendre ensuite l'extraction avec le format approprie dans un second sscanf ( ). En 
voici une illustration : 

exemple_scanf 8.c : 

#define _GNU_SOURCE /* pour avoir getlineO */ 

#include <stdio.h> 
//include <stdlib.h> 

int 
main (void) 
{ 

char * ligne; 
int taille; 

int position; 

int type_champ; 

int entier; 

f 1 oat reel ; 

while (1) { 

fprintf (stdout, "<type> <valeur> :\n"); 
ligne = NULL; 
taille = 0; 

if (getline(& ligne, & taille, stdin) == -1) 
break; 

if (sscanfdigne, "%d %n" , & type_champ, & position) != 1) { 
fprintf (stdout, "Entrez le type (0=int, l=f 1 oat ) " 
"suivi de la valeur \n") ; 

freed igne) ; 
continue; 

} 
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if (type_champ == 0) { 

if (sscanf(& (1 igne[position] ) , "Id", &entier) != 1) 
fprintf (stdout, "Valeur entiere attendue \n"); 

el se 

fprintf (stdout, "Ok : %d\n", entier); 
} else if (type_champ == 1) { 

if (sscanf(& (1 igne[posi tion] ) , "%f" , & reel) != 1) 
fprintf (stdout, "Valeur reelle attendue \n"); 

el se 

fprintf (stdout, "Ok : %e\n", reel); 

} else { 

fprintf (stdout, "Type inconnu (0 ou l)\n"); 

} 

freed igne) ; 

} 

return EXIT_SUCCESS; 

} 

On arrete la boucle principale de ce programme en faisant echouer getl i ne( ), en lui envoyant 
EOF (Controle-D) en debut de ligne. Voici un exemple d' execution : 

$ ./exemple_scanf_8 

<type> <valeur> : 

Entrez le type (0=int, l=float) suivi de la valeur 
<type> <valeur> : 
0 A 

Valeur entiere attendue 
<type> <valeur> : 

0 12 
Ok : 12 

<type> <valeur> : 

1 Z 

Valeur reelle attendue 
<type> <valeur> : 

1 23.4 

Ok : 2.340000e+01 
<type> <valeur> : 

2 ZZZ 

Type inconnu (0 ou 1) 
<type> <valeur> : 
$ 

II est egalement possible de restreindre le jeu de caracteres utilisables lors d'une saisie de 
texte, en utilisant une directive 111 a la place de %s, et en indiquant a l'interieur des crochets 
les caracteres autorises. On peut signaler des intervalles du genre %[A-Za-z], des negations 
avec le signe A en debut de directive, comme %[ A 0-9] pour refuser les chiffres. Si on veut 
mentionner le caractere ']', il faut le placer en premier, et pour indiquer '[', on le place en 
dernier, comme dans ![](){}[], qui regroupe les principaux symboles d'encadrement. On 
notera que cette conversion ne saute pas automatiquement les espaces en tete, contrairement 
a %s. Comme pour cette derniere conversion, il y a lieu d'etre prudent pour eviter les deborde- 
ments de chaines, soit en mentionnant une taille maximale %5[A-Z] qui convertit au plus cinq 
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majuscules, soit en demandant a la bibliotheque d'allouer la memoire necessaire (en lui 
passant un pointeur sur un pointeur sur une chaine). 

Avec toutes leurs possibilites, les fonctions de la famille scanf ( ) sont tres puissantes. Toute- 
fois, elles reclament beaucoup d' attention lors de la lecture des donnees si plusieurs champs 
sont presents sur la meme ligne. Lorsque la syntaxe d'une ligne est tres compliquee et qu'une 
lecture champ par champ comme dans notre dernier exemple est vraiment rebarbative, il est 
possible de se tourner vers un analyseur syntaxique qu'on pourra construire a l'aide de flex 
et bi son , par exemple. 

Conclusion 

Nous avons examine ici les differentes fonctions d' entree-sortie simples pour un programme. 

Comme nous l'avions deja indique avec printf ( ), revolution actuelle des interfaces graphi- 
ques conduit les utilisateurs a se detourner des applications dont les donnees sont saisies 
depuis un terminal classique. A moins de construire un programme qui, a la maniere d'un 
filtre, recoive sur son entree standard des donnees provenant d'une autre application, il est de 
plus en plus rare d'utiliser scanf ( ) ouf scanf () surstdin. Par contre, l'emploi de sscanfO 
est toujours d'actualite. En effet, la saisie de donnees par F intermediate d'une interface 
graphique se fait souvent dans une boite de dialogue, dont les composants de saisie renvoient 
leur contenu sous forme de chaine de caracteres. II est alors du ressort du programme appe- 
lant de convertir ces chaines dans le format de donnee qu'il desire (entier, reel, voire poin- 
teur). II peut utiliser a ce moment sscanfO ou d'autres fonctions de conversion que nous 
etudierons ulterieurement, comme strtol ( ), strtocK ) ou strtoul ( ). 

Les commandes de redirection des entrees-sorties standards sont presentees, par exemple, 
dans [BLAESS 2001] Langages de scripts sous Linux. La plupart des fonctions de la biblio- 
theque C Ansi et principalement stdio sont decrites dans [KERNIGHAN 1994] Le langage C, 
qui reste une reference incontournable. 
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Dans ce chapitre nous allons approcher les mecanismes sous-jacents lors de F execution des 
programmes. Nous etudierons tout d'abord les differents etats dans lesquels un processus 
peut se trouver, ainsi que Finfluence du noyau sur leurs transitions. 

Nous analyserons ensuite les methodes simples permettant de modifier la priorite d'un 
processus par rapport aux autres. 

Enfin, nous observerons les fonctionnalites definies par la norme SUSv3, qui permettent de 
modifier F ordonnancement des processus, principalement dans 1' esprit d'un fonctionnement 
temps-reel. 

Etats d'un processus 

Independamment de toute mecanique d' ordonnancement, un processus peut se trouver dans 
un certain nombre d' etats differents, en fonction de ses activites. Ces etats peuvent etre 
examines a Faide de la commande ps ou en regardant le contenu du pseudo-fichier /proc/ 
<pid>/status. Ce dernier contient en effet une ligne State: . . . indiquant Fetat du processus. 
Nous utiliserons de preference cette seconde methode, car elle permet d'eviter de lancer un 
processus supplemental (ps), qui est le seul a etre reellement actif au moment de Finvoca- 
tion, sur une machine monoprocesseur du moins. 

Les differents etats d'un processus sont les suivants : 



etat 


Anglais 


Signification 


Execution 


Running (R) 


Le processus est en cours de fonctionnement, il effectue un travail actif. 


Sommeil 


Sleeping (S) 


Le processus est en attente d'un evenement exterieur. II se met en sommeil. 


Arret 


Stopped (T) 


Le processus a ete temporairement arrete par un signal. II ne s'execute plus et ne 
reagira qu'a un signal de redemarrage. 


Zombie 


Zombie (Z) 


Le processus s'est termine, mais son pere n'a pas encore lu son code de retour. 
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II n'y a pas grand-chose a ajouter sur l'etat Running. Le processus s'execute normalement, il 
a acces au processeur de la machine et avance dans son code executable. 

Les processus en sommeil sont generalement en attente d'une ressource ou d'un evenement 
exterieur. Dans la plupart des cas, ils attendent le resultat d'une operation d'entree-sortie. 
Lorsqu'un programme veut ecrire sur son terminal de sortie standard, le noyau prend le 
controle (a travers l'appel-systeme write ( ) sous-jacent) et assure Fecriture. Toutefois, la duree 
de reaction d'un terminal est relativement longue. Aussi le noyau bascule-t-il le processus en 
sommeil, en attente de la fin de Fecriture. Une fois que celle-ci est terminee, le processus se 
reveille et reprend son execution. 

Notons enfin qu'il existe deux types de sommeil : interruptible et ininterruptible. Dans le 
premier etat, un processus peut etre reveille par Farrivee d'un signal. Dans le second cas, 
le processus ne peut etre reveille que par une interruption materielle recue par le noyau. Le 
sommeil « ininterruptible » est represente par la lettre D dans le resultat de ps. Ce cas est rare 
mais peut arriver, notamment lorsque des problemes de montage de systemes de fichiers (par 
exemple par protocole NFS) entrent en consideration. On peut ainsi trouver parfois un 
processus mount bloque dans un sommeil ininterruptible suite a un probleme materiel ; il ne 
faut pas s'etonner qu'il ne reponde a aucun signal - y compris SIGKILL (9) - et ne dispa- 
raitra pas avant le prochain reboot du systeme. 

Lorsqu'un processus recoit un signal SIGSTOP, il est arrete temporairement mais pas termine 
definitivement. Ce signal peut etre engendre par l'utilisateur (avec /bin/ kill par exemple), 
par le terminal (generalement avec la touche Controle -Z), ou encore par un debogueur comme 
gdb qui interrompt le processus pour l'executer pas a pas. Le signal SIGCONT permet au 
processus de redemarrer ; il est declenche soit par /bin/kill, soit par le shell (commandes 
internes bg ou f g), ou encore par le debogueur pour reprendre l'execution. 

Enfin, un processus qui se termine doit renvoyer une valeur a son pere. Cette valeur est celle 
qui est fournie a 1' instruction return ( ) de la fonction mai n( )ou dans 1' argument de la fonction 
exit( ). Nous avons deja aborde ces notions avec les fonctions de la famille wait( ) , etudiees 
au chapitre 5. Tant que le processus pere n'a pas lu cette valeur, le fils reste dans un etat inter- 
mediate entre la vie et la mort, toutes ses ressources ont ete liberees, mais il conserve une 
place dans la table des taches sur le systeme. On dit qu'il est a l'etat Zombie. Si le processus 
pere ignore explicitement le signal SIGCHLD, le processus meurt tout de suite, sans rester a 
l'etat zombie. Si, au contraire, le processus pere ne lit jamais la valeur de retour et laisse 
a SIGCHLD son comportement par defaut, le fils restera a l'etat zombie indefiniment. Lorsque le 
processus pere se termine a son tour, le fils orphelin est adopte par le processus numero 1, 
init, qui lit immediatement sa valeur de retour (meme s'il n'en a aucune utilite), permettant 
enfin a cette pauvre ame d'acceder au repos eternel des processus. . . 

Dans l'exemple suivant, nous allons faire passer un processus - et son fils - par tous ces 
stades. Tout d'abord, notre processus va consulter son propre etat dans le pseudo-systeme de 
fichiers /proc, puis il va se scinder avec forkO avant de s'endormir pendant quelques 
secondes (en attente done d'un signal de reveil). Son fils profitera de ce laps de temps pour 
afficher l'etat du pere, puis se terminera immediatement. A son reveil, le processus pere 
examinera l'etat de son fils avant et apres avoir lu le code de retour. Ensuite, le processus se 
met en sommeil, en attente d'une saisie de caracteres. 
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exemple_status.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <sys/wait.h> 

void 

affiche_status (pid_t pid) 
{ 

FILE * fp; 

char chaine[80] ; 

sprintf (chaine, "/proc/%1 d/status" , (long) pid); 
if ((fp = fopen(chaine, "r")) == NULL) { 

fprintf (stdout, "Processus inexistant\n") ; 

return; 

} 

while (fgets(chaine, 80, fp) NULL) 

if (strncmp(chaine, "State", 5) == 0) { 
fputstchaine, stdout); 
break; 

} 

f cl ose(fp) ; 



i nt 
main (void) 

{ 

pid_t pid; 

char chaine[5]; 

fprintf (stdout, "PID = %1 d\n" , (long) getpidO); 
fprintf (stdout, "Etat attendu = Running \n"); 
affiche_status(getpid( ) ) ; 
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if ( (pid = forkO) == -1) { 
perror("fork ()"); 
exit(EXIT_FAILURE); 

} 

if (pid != 0) { 
si eep(5) ; 

fprintf (stdout, "Consultation de l'etat de mon fils...\n"); 
fprintf (stdout, "Etat attendu = Zombie \n"); 
aff i che_status(pid) ; 

fprintf (stdout, "Pere ; Lecture code retour du fils...\n"); 
wait(NULL); 

fprintf (stdout, "Consultation de l'etat de mon fils...\n"); 
fprintf (stdout, "Etat attendu = inexistant\n") ; 
affiche_status(pid) ; 
} else { 

fprintf (stdout, "Fils : consultation de l'etat du pere...\n"); 

fprintf (stdout, "Etat attendu = Sleeping \n"); 

aff i che_status(getppid( ) ) ; 

fprintf (stdout, "Fils : Je me termine \n"); 

exit(EXIT_SUCCESS); 

} 

fprintf (stdout, "Attente de saisie de chaine \n"); 

fgets(chaine, 5, stdin); 

exit(EXIT_SUCCES); 



} 



Nous allons deja executer cet exemple, jusqu'a la saisie de chame, en observant les differents 
etats : 

$ . /exemple_status 

PID = 787 

Etat attendu = Running 
State: R (running) 

Fils : consultation de l'etat du pere... 
Etat attendu = Sleeping 
State: S (sleeping) 
Fils : Je me termine 
Consultation de l'etat de mon fils... 
Etat attendu = Zombie 
State: Z (zombie) 

Pere : Lecture code retour du fils... 
Consultation de l'etat de mon fils... 
Etat attendu = inexistant 
Processus inexistant 
Attente de saisie de chalne 

Le processus est done en attente de saisie. Nous allons a ce moment lancer gdb depuis une 
autre console et utiliser la commande attach de gdb pour deboguer le processus en cours de 
fonctionnement. Nous pourrons alors lancer la commande cat /proc/787/status a Faide 
de l'instruction shel 1 de gdb : 



I 



$ gdb exemple_status 
GNU gdb 4.18 
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Copyright 1998 Free Software Foundation, Inc. 
[...] 
(gdb) attach 787 

Attaching to program: /home/ccb/Exempl es/exempl e_status , Pi d 787 

Reading symbols from /l ib/1 ibc.so.6. . .done. 

Reading symbols from /l ib/ld-1 inux.so.2. . .done. 

0x400bddb4 in _libc_read () from /lib/1 ibc.so.6 

(gdb) shell cat /proc/787/status | grep State 

State: T (stopped) 

(gdb) detach 

Detaching from program: /home/ccb/Exempl es/exempl e_status, Pid 787 

(gdb) quit 

$ 

Cela nous permet de verifier que le processus en cours de debogage est bien arrete entre les 
executions pas a pas. 



Fonctionnement multitache, priorites 

Jusqu'a present, nous avons considere que le processus est seul, qu'il s'execute sur un proces- 
seur qui lui est attribue. Cela peut etre le cas sur une machine multiprocesseur (SMP) peu 
chargee, mais c'est rare. Sur un systeme multitache, Faeces au processeur est une ressource 
comme les autres (memoire, disque, terminaux, imprimantes. . .) qui doit se partager entre les 
processus concurrents. 

Dans le cadre de ce chapitre, nous considererons principalement le cas des machines uni- 
processeurs. On pourra presque toujours generaliser notre propos aux ordinateurs multipro- 
cesseurs des que le nombre de processus concurrents sur le systeme augmentera. 

Le noyau est charge d' assurer la commutation entre les differents programmes pour leur offrir 
Faeces au processeur. C'est tres facile lorsqu'un processus s'endort. N'oublions pas que 
toutes les transitions entre etats que nous avons vues plus haut se passent toujours par Finter- 
mediaire d'un appel-systeme ou de Farrivee d'un signal. Aussi, le noyau a toujours le 
controle total de Fetat des processus. Lorsque Fun d'eux s'endort, en attente d'une saisie de 
Foperateur par exemple, le noyau peut alors elire un autre programme pour lui attribuer 
Faeces au processeur. 

Seulement ce n'est pas encore suffisant, on ne peut guere compter sur la bonne volonte de 
chaque processus pour s'endormir regulierement pour laisser un peu de temps CPU dispo- 
nible pour les autres. La moindre erreur de programmation du genre 

while (1); 

/* Executer un travail */ 

bloquerait totalement le systeme (notez le « ; » en trop a la suite du whi 1 e( ) , qui engendre 
une boucle infinie). 

Pour eviter ce probleme, le noyau doit interrompre au bout d'un certain temps un processus 
qui s'execute sans avoir besoin de s'endormir (en effectuant des calculs par exemple), afin 
qu'il cede la place a un autre programme. On dit que le noyau realise une preemption du 
processeur, ce qui a donne naissance au terme de multitache preemptif. 

Avec ce mecanisme, le noyau peut intervenir lorsqu'un processus depasse le quantum de 
temps qui lui est imparti. Le processus passe alors a Fetat Pret. Un processus pret est done 
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simplement un processus en cours d' execution qui a ete suspendu par le noyau et qui 
reprendra son travail des que celui-ci lui reaffectera le processeur. 

Au niveau de la commande ps ou du pseudo-fichier /proc/<pid>/status, il n'y a aucune 
difference entre un processus effectivement en execution et un processus pret. lis sont tous 
deux indiques par la lettre R. Cela explique pourquoi la commande ps aux presente parfois 
une liste contenant simultanement plusieurs processus a Fetat R sur une machine uni -processeur. 

Un corollaire de ce mecanisme est qu'un processus qui se reveille, par exemple a cause d'une 
operation d' entree-sortie terminee ou de Farrivee d'un signal, ne passe pas directement de 
Fetat Sommeil a Fetat Execution, mais passe par un etat transitoire Pret, et c'est Fordonnan- 
ceur qui decidera du veritable passage en Execution. 

Une application n'a done habituellement aucune raison de se soucier de l'ordonnancement 
assure par le noyau, tout se passe de maniere totalement transparente. Un processus a toujours 
l'impression d'etre en cours d' execution. Malgre tout, il faut etre conscient qu'une applica- 
tion qui effectue de larges plages d' operations sans reclamer d' entree-sortie emploie beau- 
coup la seule ressource qui soit vraiment indispensable pour tous les processus : le CPU. 
Cette application penalisera done les autres logiciels qui font un usage plus raisonnable du 
processeur. 

Le noyau utilise, pour pallier ce probleme, le principe de priorite double. Une valeur statique 
de priorite est donnee a tout processus des son demarrage et peut partiellement etre corrigee 
par un appel-systeme approprie. L'ordonnanceur se sert de cette valeur statique pour calculer 
une nouvelle valeur, nommee priorite dynamique, et qui est remise a jour a chaque fois que le 
processus est traite par l'ordonnanceur. Cette priorite dynamique est entierement interne au 
noyau et ne peut pas etre modifiee. Plus un processus utilise le temps CPU qui lui est imparti, 
plus le noyau diminue sa priorite dynamique. Au contraire, plus le processus rend vite la main 
lorsqu'on l'execute, plus le noyau augmente sa priorite. Avec cette politique, les taches qui 
exploitent peu le processeur - declenchant une operation d' entree-sortie et s'endormant 
aussitot en attente du resultat - passeront beaucoup plus rapidement de Fetat Pret a l'Execu- 
tion effective que les taches qui grignotent tous les cycles CPU qu'on leur offre, sans jamais 
redonner la main volontairement. 

Cette organisation de l'ordonnanceur permet d'ameliorer en partie la fiuidite du systeme. 
Malgre tout, lorsqu'on lance sur une machine uni -processeur plusieurs processus qui devo- 
rent les cycles CPU en boucle, une nette diminution des performances du systeme est 
sensible. Pourtant, une grande partie des programmes qui font beaucoup de calculs et peu 
d' entrees-sorties ne presentent pas de caractere d'urgence. En voici quelques exemples : 

• Une application recoit des informations numeriques, les affiche et les rediffuse. Elle 
execute regulierement des operations de calcul statistique dont le resultat n'est imprime 
qu'une fois par mois. 

• Un systeme d'enregistrement collecte des blocs de donnees, les regroupe en petits fichiers 
correspondant chacun a une heure de trafic, puis les transfere sur un repertoire accessible 
en FTP anonyme, ou d' autres machines viendront les recuperer. Pour diminuer le volume 
des transferts ulterieurs, on comprime les fichiers en invoquant gzi p par exemple. 

• Une application de creation d' image numerique permet d'utiliser un modeleur affichant la 
scene en preparation sous forme de squelette adapte a la definition de Fecran. Avant le 
transfert vers le systeme de photocomposition definitif, F image en tres haute resolution est 
calculee par un processus complexe de calcul (ray-tracing par exemple). 
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Dans tous ces exemples, on remarque qu'une partie du travail est fortement consommatrice 
de cycles CPU (le calcul statistique, la compression de donnees, le traitement d' image) alors 
que le resultat n'est pas indispensable immediatement. On ne peut toutefois pas se reposer 
entierement sur le noyau pour « freiner » systematiquement ce genre d' operations, car il 
existe aussi de nombreux cas oil on attend impatiemment le resultat d'un travail intense du 
processeur. Le meilleur exemple pour le developpeur est probablement la recompilation d'un 
logiciel relativement consequent, et la surdose de cafeine et de sucreries qui finit par meubler 
P attente obligatoire . . . 

II est done necessaire de pouvoir donner au noyau une indication de la priorite qu'on affecte 
a tel ou tel travail. Lorsque plusieurs processus seront prets, le noyau choisira d'abord celui 
dont la priorite dynamique est la plus importante. Lors du calcul de la priorite dynamique, 
Pordonnanceur utilise la priorite statique conjointement a d'autres facteurs, comme le fait que 
le processus ait relache le processeur avant Pexpiration de son delai, Pemplacement reel du 
processus - sur les systemes multiprocesseurs - ou la disponibilite immediate de son espace 
d'adressage complet (ce qui concerne principalement les threads que nous etudierons au 
prochain chapitre). 

Plus un processus a une priorite dynamique elevee, plus la tranche de temps qu'on lui allouera 
sera longue. C'est un moyen de punir les programmes qui bouclent, en les laissant travailler 
quand meme, mais sans trop perturber les autres processus. Lorsqu'un processus a consomme 
tous ses cycles, il ne sera reelu pour Pacces au processeur que dans le cas oil aucun autre 
processus plus courtois n'est pret. 

Lorsqu'un processus desire influer sur sa propre priorite statique, il peut utiliser Pappel- 
systeme ni ce( ). On indique a celui-ci la « gentillesse » dont le processus appelant desire faire 
preuve. La declaration de cette fonction se trouve dans <uni std . h> : 

int nice (int increment) ; 

La valeur transmise est ajoutee a notre gentillesse vis-a-vis des autres processus. Cela signifie 
qu'un increment positif diminue la priorite du processus, alors qu'un increment negatif 
augmente sa priorite. Seul un processus ayant PUID effectif de root ou la capacite CAP_SYS_ 
NICE peut diminuer sa gentillesse. La plage de valeur utilisee en interne par Pordonnanceur 
pour les priorites statiques s'etale de 0 a 40. Toutefois, par convention on presente la 
gentillesse d'un processus sur une echelle allant de -20 (processus tres egoiste) a +20, la 
valeur 0 etant celle par defaut. Un utilisateur normal ne peut done avoir acces qu'a la plage 
allant de 0 a 20. 

Dans l'exemple suivant, le programme va lancer cinq processus his, chacun d'eux prenant 
une valeur de gentillesse differente et se mettant a boucler sur un comptage. Le processus 
pere les laisse travailler pendant 5 secondes et les arrete. Pour synchroniser le debut et la fin 
du comptage pour les differents his, nous utilisons un signal emis par le pere a destination du 
groupe de processus. Pour etre stir que les fils ont tous demarre avant d'envoyer le signal, le 
pere respecte un petit sommeil d'une seconde ; c'est une methode imparfaite, mais qui fonc- 
tionne sur un systeme peu charge. 

exemple_nice.c : 

#define _GNU_SOURCE 
#include <signal .h> 
#include <stdio.h> 
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//include <stdlib.h> 
#include <sys/wait.h> 
//include <unistd.h> 

volatile long compteur = 0; 
static int gentillesse; 

void 

gestionnaire (int numero) 
{ 

if (compteur != 0) ( 

fprintf(stdout, "Fils ftld (nice %Zd) Compteur = %91 d\n" , 

(long) getpidO, gentillesse, compteur); 
exit(EXIT_SUCCESS); 

} 

} 

//define NB_FILS 5 

int 
main (void) 
{ 

pid_t pid; 
int fils; 

/* Creation d'un nouveau groupe de processus */ 
setpgid(0, 0); 

signal (SIGUSR1, gestionnaire); 
for (fils = 0; fils < NB_FILS; fils ++) { 
if ((pid = forkO) < 0) { 

perror( "fork" ) ; 

exit(EXIT_FAILURE); 

} 

if (pid != 0) 
continue; 

gentillesse = fils * (20 / (NB_FILS - 1)); 
if (nice(gentillesse) < 0) { 

perrorCnice") ; 

exit(EXIT_FAILURE); 

} 

/* attente signal de demarrage */ 

pause( ) ; 

/* comptage */ 

while (1) 

compteur ++; 

} 

/* processus pere */ 
signaKSIGUSRl, SIG_IGN); 
sleep(l) ; 

kilK-getpgid(O), SIGUSR1); 
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sleep(5) ; 

kilK-getpgid(O), SIGUSR1); 
while (wait(NULL) > 0) 

exit(EXIT_SUCCESS); 

} 

L' execution montre bien que les processus ont eu un acces different au processeur, inverse- 
ment proportionnel a leur indice de gentillesse : 

$ ./exemple_nice 

Fils 1849 (nice 10) Compteur = 91829986 
Fils 1850 (nice 15) Compteur = 42221693 
Fils 1851 (nice 20) Compteur = 30313573 
Fils 1847 (nice 0) Compteur = 183198223 
Fils 1848 (nice 5) Compteur = 133284576 
$ 

Cela interessera done le programmeur dont F application declenche plusieurs processus, 
certains effectuant beaucoup de calculs peu urgents. De telles taches auront interet a diminuer 
leur priorite (augmenter leur gentillesse) pour conserver un fonctionnement plus fiuide au 
systeme. 



Modification de la priorite d'un autre processus 

Pouvoir modifier sa propre priorite est une bonne chose, mais il y a de nombreux cas ou on 
aimerait changer la priorite d'un autre processus deja en execution. L'exemple est fourni par 
Futilitaire /usr/bin/renice, qui permet de diminuer la priorite d'un processus s'il charge trop 
lourdement le processeur ou au contraire de 1' augmenter (a condition d' avoir les privileges 
necessaires). Ces operations sont possibles grace a deux appels-systeme getpriorityO et 
setpriority( ) qui sont declares dans <sys/wai t . h> : 

int getpriority (int classe, int identifiant) 

int setpriority (int classe, int identifiant, int valeur) 

Ces deux appels-systeme ne travaillent pas obligatoirement sur un processus particulier, mais 
peuvent agir sur un groupe de processus ou sur tous les processus appartenant a un utilisateur 
donne. 

En fonction de la classe indiquee en premier argument, 1' identifiant fourni en second est inter- 
prete differemment : 





Valeur de classe 


Type d'identifiant 


PRI0_ 


.PROCESS 


PID du processus vise. 


PRI0. 


_PGRP 


PGID du groupe de processus concerne. 


PRI0 




_USER 


UID de I'utilisateur dont on vise tous les processus. 



La valeur de retour de getpriorityO correspond a la priorite statique du processus, qui 
s'etend dans l'intervalle PRIO_MIN a PRIOJVIAX, qui valent typiquement -20 et 20. Aussi 
lorsque getpriority( ) renvoie -1, on ne peut etre sur qu'il s'agit d'une erreur qu'a condition 
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d'avoir mis errno a 0 avant l'appel, et en verifiant alors son etat. Lorsque plusieurs processus 
sont concernes par getpriority( ), la valeur renvoyee se rapporte a la plus petite de toutes 
leurs priorites. Les valeurs de priorite considerees ici representent en realite des quantites 
de gentillesse. Plus la valeur est petite (proche de -20), plus le processus est prioritaire. 
L'exemple suivant va nous permettre de consulter les priorites. 

exemple_getpriority.c : 

//include <ctype.h> 
//include <errno.h> 
//include <stdio.h> 
//include <stdlib.h> 
//include <sys/resource.h> 

void 

syntaxe (char * nom) 
{ 

fprintf (stderr, "Syntaxe : %s <classe> <identifiant> \n", nom); 
fprintf(stderr, " <classe> = P (PID)\n"); 
fprintf(stderr, " G (PGIDAn"); 

fprintf(stderr, " U (UID)\n") : 

exit(EXIT_FAILURE); 

} 

int 

main (int argc, char * argv[]) 
{ 

int classe; 

int identifiant; 

int priorite; 

if (argc != 3) 

syntaxe(argv[0] ) ; 
if (toupper(argv[l][0]) == 'P') 

classe = PRI0_PR0CESS; 
else if (toupper(argv[l][0] ) == 'G') 

classe = PRI0_PGRP; 
else if (toupper(argv[l][0] ) == 'IT) 

classe = PRIOJJSER; 

el se 

syntaxe(argv[0] ) ; 
if (sscanf(argv[2], "%d" , & identifiant) != 1) 

syntaxe(argv[0] ) ; 
errno = 0; 

priorite = getpriority(classe, identifiant); 
if ((priorite == -1) && (errno != 0)) 
perror(argv[2]); 

el se 

fprintf (stderr, "%d : %d\r\" , identifiant, priorite); 
return EXIT_SUCCESS; 

} 
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L'exemple d' execution ci-dessous presente un interet limite. II est plus utile de comparer les 
valeurs obtenues par ce programme et celles qu'on visualise avec la commande ps, ou encore 
mieux avec le logiciel top. 

$ ./exemple_getpriority P 2982 

2982 : 15 

$ ./exemple_getpriority U 500 

500 : 0 

$ ./exemple_getpriority P 6 

6 : -20 
$ 

setpriorityO fonctionne de maniere symetrique, en fixant la nouvelle priorite statique du ou 
des processus indiques. Bien sur, des restrictions s'appliquent en ce qui concerne les droits 
d'acces au processus, et seul root (ou un programme ayant le privilege CAP_SYSJICE) peut 
rendre un processus plus prioritaire. 

Les fonctions ni ce( ), getpri ori ty ( ) ou setpriori ty ( ) ne sont pas definies par Ansi C (qui 
n'inclut pas le concept de multitache) mais elles sont indiquees dans SUSv3. Toutefois, si ces 
appels-systeme peuvent suffire pour de petites operations de configuration administrative 
(accelerer un calcul par rapport a un autre, ou diminuer la priorite des jobs ne presentant pas 
de caractere d'urgence), ils sont largement insuffisants des qu'on a reellement besoin de 
configurer le comportement de l'ordonnanceur en detail. 

Pour cela, plusieurs types d'ordonnancements ont ete definis dans la norme Posix.lb, offrant 
ainsi des possibilites approchant de la veritable programmation temps-reel. 



Les mecanismes d'ordonnancement sous Linux 

Les fonctionnalites decrites a Forigine par la norme Posix.lb, sont disponibles a condition 
que la constante symbolique P0SIX PRIORITY SCHEDULING soit definie par inclusion du fichier 
d'en-tete <unistd.h>. Elles sont alors declarees dans le fichier <sched.h>. On pourra done 
utiliser un code du genre 

#include <unistd.h> 

#ifdef _P0SIX_PRI0RITY_SCHEDULING 

#include <sched.h> 
#else 

#warning "Fonctionnalites temps-reel non disponibles" 
#endif 

et dans le corps du programme 

int 
main(void) 
{ 

#ifdef _P0SIX_PRI0RITY_SCHEDULING 

/* Basculement en ordonnancement temps-reel */ 
#else 

/* Utilisation uniquement de niceO */ 
#endif 

} 
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II existe trois types d'ordonnancement. En fait, il n'y a qu'un seul ordonnanceur, mais il 
choisit ou il rejette les processus selon trois politiques possibles. La configuration se fait 
processus par processus. Elle n'est pas necessairement globale. Par contre, la modification de 
la politique d'ordonnancement associee a un processus est une operation privilegiee, car il 
existe un - gros - risque de bloquer completement le systeme. 

Les trois algorithmes d'ordonnancement sont nommes FIFO, RR et OTHER. 

Ordonnancement sous algorithme FIFO 

L'algorithme FIFO est celui d'une file d'attente (First In First Out - premier arrive, premier 
servi). 

Dans cette optique, il existe une liste des processus pour chaque priorite statique. Le premier 
processus de la priorite la plus haute s'execute jusqu'a ce qu'il relache le processeur. II est 
alors repousse a la fin de la liste correspondant a sa priorite. Si un autre processus de meme 
priorite est pret, il est elu. Sinon, 1' ordonnanceur passe au niveau de priorite inferieur et en 
extrait le premier processus pret. Ce mecanisme se repete indefiniment. Des qu'un processus 
de priorite superieure a celui qui est en cours d' execution est de nouveau pret (parce qu'il 
attendait une entree-sortie qui vient de se terminer par exemple), 1' ordonnancement lui 
attribue immediatement le processeur. 

II existe un appel-systeme particulier, schecL yield( ), qui permet a un processus en cours 
d'execution de relacher volontairement le processeur. L ordonnanceur peut alors faire tourner 
un autre processus du meme niveau de priorite, s'il y en a un qui est pret. Par contre, si aucun 
autre processus de meme niveau n'est pret a s'executer, le processeur est reattribue au 
processus qui vient d'invoquer sched_yi el d( ). Le noyau n'elit jamais un processus si un autre 
de priorite superieure est pret. 

Cet ordonnancement est le plus violent et le plus egoiste qui soit. Le plus fort a toujours 
raison. Le processus le plus prioritaire a toujours le processeur des qu'il est pret a s'executer. 
II existe bien entendu un tres serieux risque de blocage du systeme (du moins sur une machine 
uni-processeur) si on execute un simple 

while (1) 
avec une priorite elevee. 

Pour eviter ce genre de desagrement lors d'une phase de debogage, il est important de 
conserver un shell s'executant a un niveau de priorite plus eleve que le processus en cours 
de developpement. On pourra alors executer facilement unkill -KILL... 

Si on travaille dans l'environnement X- Window, un shell de niveau superieur ne suffit pas ; 
nous verrons qu'il faut aussi faire fonctionner le serveur X et tout son environnement avec 
une priorite plus grande que le processus en debogage. Dans ce cas en effet, il ne suffit pas 
d' avoir un Xterm pour arreter le processus fautif, mais encore faut-il que le serveur X soit 
capable de faire bouger le pointeur de la souris jusqu'a la fenetre du Xterm de secours, et que 
le gestionnaire de fenetre arrive a activer cette derniere. Nous verrons des exemples de 
blocages volontaires (et temporaires) du systeme dans les prochaines sections. 

Un programme se trouvant seul au niveau de priorite FIFO le plus eleve est sur de s'executer 
de bout en bout sans etre perturbe. Par contre, si deux processus s'executent au meme niveau 
FIFO, la progression parallele des deux n'est pas tres previsible. La commutation s'effectue 
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parfois volontairement, en invoquant schecLyi el d( ), et parfois sur des appels-systeme 
bloquants qui endorment un processus. 

Le comportement d'un processus seul est presque totalement deterministe (aux retards induits 
par les interruptions materielles pres). Cela permet d' assurer un comportement temps-reel quasi 
parfait. Par contre, deux processus concurrents a la meme priorite ont des progressions impre- 
visibles. Pour ameliorer tout cela, un second type d' ordonnancement temps-reel a ete defini. 

Ordonnancement sous algorithme RR 

L' ordonnancement RR (Round Robin, tourniquet) est une simple variante de celui qui a ete 
decrit precedemment, incorporant un aspect preemptif au temps partage. Chaque processus se 
voit attribuer une tranche de temps fixe. Lorsqu'il a atteint sa limite, le noyau l'interrompt et 
le met en etat Pret. Ensuite, il le repousse a la fin de la liste des processus associee a sa prio- 
rite. Si un autre processus du meme niveau est pret, il sera choisi. Si aucun autre processus de 
meme priorite n'est pret, le noyau redonne la main au programme qu'il vient d'interrompre. 
On ne donne jamais le processeur a un processus de plus faible priorite. 

La difference avec 1' algorithme FIFO reside done uniquement dans le cas ou plusieurs pro- 
cessus sont simultanement prets avec la meme priorite (et si aucun processus de plus haute 
priorite n'est pret). Dans le cas de 1'algorithme FIFO, le premier processus qui arrive recoit le 
processeur et le conserve jusqu' a ce qu'il s'endorme ou qu'il le relache volontairement avec 
sched_yield( ). Avec 1' ordonnancement RR, chaque processus pret de la plus haute priorite 
sera regulierement choisi pour s'executer, quitte a interrompre Fun de ses confreres qui ne 
veut pas s'arreter de lui-meme. 

Si deux processus ont la meme priorite, chacun aura done l'impression de s'executer deux 
fois moins vite que s'il etait seul, mais aucun des deux ne sera bloque pour une periode a 
priori inconnue, comme e'etait le cas avec 1' ordonnancement FIFO. 

Ordonnancement sous algorithme OTHER 

Le troisieme type d' ordonnancement est 1'algorithme OTHER (autre), qui n'est pas reelle- 
ment defini par Posix.lb. L implementation de cet algorithme est laissee a la discretion des 
concepteurs du noyau. Sur certains systemes, il peut s'agir d'ailleurs de 1'algorithme RR, 
avec des plages de priorite plus faibles. 

Sous Linux, il s'agit de 1' ordonnancement par defaut dont nous avons deja parle, utilisant une 
priorite dynamique recalculee en fonction de la priorite statique et de l'usage que le processus 
fait du laps de temps qui lui est imparti. 

II est important de savoir que les algorithmes dits temps-reel (FIFO et RR) ont des plages de 
priorite qui sont toujours superieures a celles des processus s'executant avec ralgorithme 
OTHER. Autrement dit, un processus FIFO ou RR aura toujours la preseance sur tous les 
processus OTHER, meme ceux dont la gentillesse est la moindre. 

Recapitulation 

L'ordonnanceur fonctionne done ainsi : 

1. S'il existe un ou plusieurs processus FIFO ou RR prets, ils sont selectionnes en premier. 
Celui dont la priorite est la plus grande est choisi. S'il s'agit d'un processus RR, on 
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programme un delai au bout duquel le processus sera rejete en fin de sa liste de priorite s'il 
n'a pas rendu le processeur auparavant. 

2. Si aucun processus FIFO ou RR n'est pret, le noyau recalcule les priorites dynamiques des 
processus OTHER prets, en fonction de leurs priorites statiques, de leur utilisation du 
CPU, et d'autres parametres (emplacement sur une machine multiprocesseur, disponibilite 
de l'espace memoire...). En fonction de la priorite dynamique, un processus est elu, et le 
noyau lui attribue le processeur pendant un delai maximal. 

3. Si aucun processus n'est pret, le noyau peut arreter le processeur sur les architectures i386 
par exemple, jusqu'a l'arrivee d'une interruption signalant un changement d'etat. 

Temps-reel ? 

Nous avons evoque aplusieurs reprises le terme d'ordonnancement temps-reel. Certains sont 
sceptiques, et a juste titre, sur l'emploi de ce mot a propos de Linux ou de tout systeme Unix 
en general. 

II existe deux classes de problemes relevant de la programmation temps-reel : 

• Le temps-reel strict, ou dur, impose pour chaque operation des delais totalement infran- 
chissables, sous peine de voir des evenements catastrophiques se produire. II s'agit par 
exemple du controle de la mise a feu d'un reacteur d' avion, du declenchement d'un 
Airbag, ou de remission des impulsions laser en microchirurgie. La sensibilite par rapport 
a la limite temporelle est telle qu'il est non seulement impensable de soumettre le 
processus aux retards dus a d'autres processus, mais egalement impossible d'admettre la 
moindre tolerance par rapport au travail meme du noyau. L'arrivee d'une interruption 
devant faire basculer un processus a l'etat Pret, la verification des taches en cours, pour 
finalement laisser la main au meme processus, peut induire un retard critique dans ces 
systemes. Pour ce type d' application, Linux n'est pas approprie. II est dans ce cas indis- 
pensable de se tourner vers d'autres systemes d' exploitation specialises dans le temps-reel 
strict, voire le projet RTAI dont le principe est de faire tourner Linux comme une tache 
d'un micro-noyau temps-reel. 

• Les applications temps-reel souples (soft) n'ont pas de contraintes aussi strictes que les 
precedentes. Les limites temporelles existent toujours, mais les consequences d'un depas- 
sement faible ne sont pas aussi catastrophiques. Dans ce genre d' application, il est impor- 
tant de subdiviser le systeme en sous-unites realisant des taches bien precises, et dont les 
priorites peuvent etre fixees avec precision. Une application pourra par exemple privilegier 
la reception et le decodage de donnees provenant de divers equipements. La transmission 
des alarmes sur defaut sera probablement traitee aussi avec une haute importance, tandis 
que l'affichage continu a destination d'un operateur pourra etre aborde avec une priorite 
legerement plus faible (si un retard de presentation n'est pas critique). Enfin, on emploiera 
une priorite radicalement moindre pour des taches administratives de statistiques, d'impres- 
sion de copies d'ecran ou de journalisation des changements d'etat. 

En utilisant un ordonnancement RR, voire FIFO, Linux peut etre parfaitement adapte a des 
applications du domaine temps-reel souple. Le comportement est deterministe entre les 
processus. Un programme de plus faible priorite ne viendra jamais perturber un processus de 
haute priorite. Les seuls ecarts temporels possibles sont dus a la gestion interne du noyau, qui 
est optimisee, et n'induit que des retards infimes. 
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Notons que les fonctionnalites temps-reel de Linux ont ete ameliorees sensiblement dans le 
noyau 2.6 : l'ordonnanceur lui-meme a ete modifie pour qu'il realise son travail (trouver 
le bon processus parmi ceux en attente et lui donner le CPU) en un temps constant quel que 
soit le nombre de processus en attente sur le systeme. Auparavant, pour decider quel est le 
processus le plus adapte a un moment donne, le noyau prenait un temps proportionnel au 
nombre de processus prets. A present ce temps est fixe. 

De plus le noyau lui-meme est devenu preemptible (qui peut etre preempte), a ne pas 
confondre avec preemptif (qui peut preempter une tache, ce qui etait deja le cas). Ceci signifie 
que F execution d'un appel systeme n'est plus necessairement atomique, et qu'un processus 
peut se trouver interrompu meme lorsqu'il execute du code appartenant au noyau. 

Pour un bon exemple de F utilisation des ordonnancements temps-reel, on peut considerer les 
applications cdda2wav et cdrecord, qui permettent sous Linux, respectivement d'extraire des 
pistes audio d'un CD pour creer des fichiers au format .WAV, et de graver un CD a partir de 
pistes audio ou d' images ISO-9660 d'une arborescence de fichiers. Ces deux utilitaires, 
lorsqu'ils sont executes avec l'UID effectif de root, basculent sur un ordonnancement temps- 
reel. Lorsque cdda2wav extrait des donnees audio, il doit rester en parfaite synchronisation 
avec le flux de bits qui lui sont transmis (le format audio des CD ne permet pas de contenir 
des informations de controle des donnees). II s'execute done avec une priorite superieure a 
celle de tous les autres processus classiques. Cette application faisant surtout des operations 
de lecture-ecriture, elle ne ralentit pourtant que tres peu les autres programmes. Par contre, 
cdrecord - du moins lorsqu'il est connecte a un graveur sur port parallele - doit assurer un 
debit particulierement constant des donnees, ce qui necessite des phases d' attente active 
(polling) au cours desquelles les autres processus sont plus fortement penalises. 

Modification de la politique d'ordonnancement 

La politique d'ordonnancement est heritee au travers d'un for k( ) ou d'un exec( ). II est done 
possible pour un processus de modifier sa propre politique, puis de lancer un shell afin d'expe- 
rimenter les differents ordonnancements. Pour modifier son ordonnancement, un processus 
doit avoir la capacite CAP_SYS_NICE, aussi allons-nous creer un programme que nous instal- 
lerons Set-UID root, permettant de lancer une commande avec 1' ordonnancement RR a la 
priorite voulue. Pour eviter les problemes de securite, ce programme reprendra Fidentite de 
l'utilisateur qui Fa lance avant d'executer la commande voulue. 

Les sources habituelles d' informations traitant des processus (ps, top, /proc/<pid>/...) ne 
nous indiquent pas la politique d'ordonnancement avec laquelle s'execute un programme. 
Nous allons done creer un petit programme qui va nous servir de frontal pour l'appel-systeme 
sched_getscheduler( ). Tous les appels-systeme que nous allons etudier ici sont definis par la 
norme Posix.lb et sont declares dans <sched.h> : 

int sched_getschedul er (int pid); 

Cet appel-systeme renvoie -1 en cas d'erreur, sinon il renvoie Fune des trois constantes 
SCHED_FIFO, SCHED_RR ou SCHED_OTHER, en fonction de F ordonnancement du processus dont 
on fournit le PID. Si on passe un PID nul, cette fonction renvoie la politique du processus 
appelant. 



280 



Programmation systeme en C sous Linux 



exemple_getscheduler.c 

#include <sched.h> 

#include <stdio.h> 

//include <stdlib.h> 

#include <unistd.h> 

void 

syntaxe (char * nom) 
{ 

fprintf (stderr, "Syntaxe %s Pi d \n", nom); 
exit(EXIT_FAILURE); 

} 

int 

main (int argc, char * argv[]) 
{ 

int ordonnancement; 
int pid; 

if ((argc != 2) || (sscanf (argv[l] , , & pid) != 1) ) 

syntaxe(argv[0] ) ; 
if ((ordonnancement = sched_getscheduler(pid)) < 0) { 

perror( "sched_getschedul er" ) ; 

exit(EXIT_FAILURE); 

} 

switch (ordonnancement) { 

case SCHED_RR : fprintf (stdout, "RR \n"); break; 
case SCHED_FIFO : f pri ntf( stdout , "FIF0\n"); break; 
case SCHED_OTHER : f pri ntf( stdout , "0THER\n" ) ; break; 
default : fprintf(stdout, "???\n"); break; 

} 

return EXIT_SUCCESS; 

} 

L' execution permet de verifier que les processus courants s'executent sous F ordonnancement 
OTHER. Nous reutiliserons ce programme lorsque nous aurons modifie notre propre poli- 
tique. 

$ ps 

PID TTY TIME CMD 

693 pts/0 00:00:00 bash 

790 pts/0 00:00:00 ps 
$ ./exemple_getscheduler 693 
OTHER 

$ ./exemple_getscheduler 0 
OTHER 

$ ./exemple_getscheduler 1 

OTHER 

$ 



Nous avons mentionne que les processus temps-reel disposaient d'une priorite statique toujours 
superieure a celle des processus classiques, mais les intervalles ne sont pas figes suivant les 
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systemes. II est important, pour respecter la portabilite d'un programme, d'utiliser les appels- 
systeme sched_get_priority_max( ) et sched_get_priority_min( ), qui donnent les valeurs 
minimales et maximales des priori tes associees a une politique d' ordonnancement donnee. 

int sched_get_priority_min (int politique); 
int sched_get_priority_max (int politique); 

Leur emploi est evident. 
exemple_get_priority.c : 

#include <sched.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

int 
main (void) 

{ 

fprintf (stdout, "Ordonnancement FIFO :\n %d <= priorite <= %d\n", 

sched_get_priority_min(SCHED_FIFO) , 

sched_get_priority_max(SCHED_FIFO) ) ; 
fprintf (stdout, "Ordonnancement RR :\n %d <= priorite <= %d\r\" , 

sched_get_pri ori tyjni n ( SCHED_RR) , 

sched_get_priority_max(SCHED_RR) ) ; 
fprintf (stdout, "Ordonnancement OTHER :\n %d <= priorite <= %d\n", 

sched_get_pri ori ty_mi n ( SCHED_OTHER) , 

sched_get_priority_max(SCHED_OTHER)) ; 
return EXIT_SUCCESS; 

} 

Les intervalles, sous Linux, sont les suivants : 

$ ./exemple_get_priority 

Ordonnancement FIFO : 

1 <= priorite <= 99 
Ordonnancement RR : 

1 <= priorite <= 99 
Ordonnancement OTHER : 

0 <= priorite <= 0 

$ 

Nous voyons que la priorite statique d'un processus OTHER est toujours nulle, mais qu'elle 
est ponderee par la valeur de gentillesse (etudiee plus haut) afin de permettre de calculer la 
priorite dynamique. 

Lorsqu'une application doit attribuer des priorites differentes a ses processus, executes sur un 
modele RR ou FIFO, elle doit d'abord consulter les valeurs fournies par ces deux appels- 
systeme, et echelonner ses priorites dans l'intervalle disponible. C'est la seule maniere d'etre 
vraiment portable selon SUSv3. 

Pour connaitre ou modifier la priorite statique d'un processus, il faut utiliser une structure de 
type sched_param. Celle-ci peut contenir divers champs, mais le seul qui soit defini par 
Posix.lb est sched_priority, qui represente bien entendu la priorite statique du processus. 
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Les deux appels-systeme sched_getparam( ) et sched_setparam( ) permettent de modifier le 
parametrage d'un processus. 

int sched_getparam ( pi d_t pid, struct sched_param * param); 

int sched_setparam (pid_t pid, const struct sched_param * param); 

L'un comme F autre renvoient 0 si la consultation ou la modification a reussi, et -1 en cas 
d'echec. 

II existe un autre parametre, consultable mais non modifiable : il s'agit de la duree de la 
tranche de temps affectee a un processus lorsqu'il est ordonnance sur le mode RR. L'appel- 
systeme sched_rr_get_interval ( ) permet de lire cette duree. 

int sched_rr_get_interval (pid_t pid, struct timespec * intervalle); 

La structure timespec que nous avons deja rencontree propose les champs tv_sec, qui repre- 
sente des secondes, et tvjisec, qui contient le complement en nanosecondes. 

Nous pouvons done completer notre programme pour lire toutes les informations concernant 
l'ordonnancement d'un processus. 

exemple_ordonnancement.c : 

#include <errno.h> 
#include <sched.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <sys/time.h> 
#include <sys/resource.h> 

void 

syntaxe (char * nom) 
{ 

fprintf (stderr, "Syntaxe %s Pid \n", nom); 
exit(EXIT_FAILURE); 

} 

int 

main (int argc, char * argv[]) 
{ 

int pid; 
int ordonnancement; 
int prior; 
struct sched_param param; 
struct timespec intervalle; 

if ((argc != 2) || (sscanf (argv[l] , "%d", & pid) != 1) ) 

syntaxe(argv[0] ) ; 
if (pid == 0) 

pid = (int) getpid( ) ; 
if ((ordonnancement = sched_getscheduler(pid)) < 0) { 

perror( "sched_getschedul er" ) ; 

exit(EXIT_FAILURE); 

} 
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if (sched_getparam(pid, & param) < 0) { 
perror( "sched_getparam" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

if (ordonnancement == SCHED_RR) 

if (sched_rr_get_interval (pid, & intervalle) < 0) { 
perror("sched_rr_get_interval ") ; 
exit(EXIT_ FAILURE); 

} 

if (ordonnancement == SCHED_0THER) { 
errno = 0; 

if (((prior = getpriority(PRI0_PR0CESS, pid)) == -1) 
&& (errno != 0)) { 

perrorC'getpriority") ; 
exit(EXIT_FAILURE); 

} 

} 

switch (ordonnancement) { 
case SCHED_RR : 

printfC'RR : Priorite = %d, intervalle = %ld.£091d s. \n", 
param.sched_priority , 
intervalle. tv_sec, 
intervalle. tv_nsec) ; 
break; 
case SCHED_FIF0 : 

printfC'FIFO : Priorite = %d \n", 
param. sched_priority) ; 
break; 
case SCHED_0THER : 

printf ("OTHER : Priorite statique = %d dynamique = %d \n", 
param.sched_priority , 
prior) ; 
break; 
default : 

printf("???\n") : 
break; 



return EXIT_SUCCESS; 

} 

Pour le moment nous n'avons pas encore vu comment modifier notre ordonnancement, aussi 
le processus est-il toujours dans le mode OTHER. Toutefois, nous pouvons lancer un sous-shell 
avec la commande ni ce pour modifier la priorite dynamique (via la valeur de gentillesse). 

$ ./exemple_ordonnancement 0 

OTHER : Priorite statique = 0 dynamique = 0 
$ nice sh 

$ ./exempl e_ordonnancement 0 

OTHER : Priorite statique = 0 dynamique = 10 
$ exit 
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Rappelons que la valeur affichee en tant que priorite dynamique est en fait la valeur de gentil- 
lesse, et qu'elle est done plus elevee moins le processus est prioritaire (contrairement aux 
priorites statiques des processus temps-reel). 

Nous allons finalement nous interesser a l'appel-systeme permettant de modifier l'ordonnan- 
cement d'un processus, sched_setscheduler( ). Celui-ci est declare ainsi : 

int sched_setscheduler (pid_t pid, 

int ordonnancement, 
const struct sched_param param); 

Nous pouvons modifier F ordonnancement associe a un processus en cours d' execution. La 
structure sched_param sert a preciser la priorite dynamique. Cet appel-systeme necessite la 
capacite CAP_SYS_N ICE. Aussi, le programme suivant doit-il etre installe Set-UID root. Nous 
revenons ensuite sous l'identite effective de l'utilisateur ayant lance le programme avant 
d'executer la commande qu'il fournit en argument. Nous passons toujours en ordonnance- 
ment RR, car le mode FIFO n'aurait pas d'interet particulier pour nos experiences. 

exemple_setscheduler.c : 

#include <sched.h> 

#include <stdio.h> 

//include <stdlib.h> 

//include <unistd.h> 

void 

syntaxe (char * nom) 
{ 

fprintf (stderr, "Syntaxe %s priorite commande. .. \n" , nom); 
exit(EXIT_FAILURE); 

} 

int 

main (int argc, char * argv[]) 
{ 

int prior; 
struct sched_param param; 

if ((argc < 3) 1 1 (sscanf (argvCl] , "%d" . & prior) != 1 ) ) 

syntaxe(argv[0] ) ; 
param. sched_priority = prior; 

if (sched_setscheduler(0, SCHED_RR, & param) < 0) { 
perror( "sched_setscheduler") ; 
exit(EXIT_FAILURE); 

} 

if (seteuid(getuid( )) < 0) { 
perror( "seteuid" ) ; 
exit(EXIT_FAILURE); 

} 

execvp(argv[2] , argv + 2); 
perror( "execvp" ) ; 
return EXIT_FAI LURE ; 

} 
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Dans notre premier exemple, nous allons simplement lancer un shell en ordonnancement 
temps-reel. 

$ su 

Password: 

# chown root. root exemple_setscheduler 

# chmod u+s exempl e_setschedul er 

# Is -1 exempl e_setschedul er 

-rwsrwxr-x 1 root root 24342 Dec 9 19:40 exempl e_setscheduler 

# exit 

$ . /exempl e_setscheduler 10 sh 
$ . /exempl e_ordonnancement 0 

RR : Priorite = 10, intervalle = 0.000150000 s. 
$ 

Bon, jusque-la, tout va bien, le shell s'execute avec la priorite voulue et sous Fordonnance- 
ment RR. Nous pouvons aussi le verifier avec le programme exempl e_getschedul er ecrit plus 
haut. 

Nous allons maintenant passer a un exercice plus acrobatique. Nous allons faire boucler un 
processus jusqu'a ce qu'un signal engendre par l'appel-systeme al arm( ) le tue. Ce sera repre- 
sentatif du risque que court un developpeur pendant la mise au point d'une application utili- 
sant des processus temps-reel. Le bouclage ici sera limite a 5 secondes, mais on pourrait se 
trouver dans une situation ou tout le temps CPU est phagocyte par un processus incontrole. 

exemple_boucle.c : 

#include <unistd.h> 
int 
main (void) 

{ 

alarm(5) ; 
while (1) 

return EXIT_SUCCESS 

1 

Le compte-rendu d' execution ci-dessous ne presente pas un interet particulier. Par contre, il 
est tres utile d'effectuer soi-meme la manipulation. 

$ . /exempl e_setscheduler 10 sh 
$ . /exempl e_ordonnancement 

RR : Priorite = 10, intervalle = 0.000150000 s. 

$ . /exempl e_boucle 

Alarm clock 

$ exit 

exit 

$ 

Lorsqu'on invoque ce programme depuis un terminal situe sur le serveur X fonctionnant sur 
la meme machine (comme c'est le cas sur la majeure partie des stations Linux), le systeme est 
completement gele pendant 5 secondes. Impossible de revenir sur un ecran de texte avec 
Controle-Alt-Fl, et meme le pointeur de la souris reste immobile ! 
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Nous essayons alors de lancer un autre Xterm avec une priorite superieure, et de faire 
executer la commande top -dl pour voir Fetat des processus toutes les secondes. Des qu'on 
relance exempl e_boucl e, tout se fige a nouveau pendant 5 secondes, y compris Faffichage du 
terminal Xterm place a une priorite superieure ! C'est normal, car c'est le serveur XI 1 qui 
doit faire le rafraichissement d'ecran, et il tourne sous un ordonnancement OTHER. 

L' experience suivante consiste alors a se connecter a distance depuis le reseau avec un tel net. 
Nous relancons un shell de priorite superieure et nous executons top -dl. Le lancement de 
exempl e_boucl e sur la machine Linux gele a nouveau la mise a jour des donnees sur le shell 
distant ! En cherchant un peu, nous nous rendons compte que le demon telnetd qui gere la 
connexion distante sur la machine s'execute encore sous un ordonnancement OTHER. Meme 
si le processus top continue de fonctionner effectivement pendant l'execution de exempl e_ 
boucl e, les informations ne sont pas transmises au terminal distant pendant cette periode. 

Finalement, nous basculons sur des terminaux « texte » virtuels (avec Controle-Alt-Fl), et 
nous nous connectons sur les deux premiers terminaux . Le basculement s'effectue avec Alt- 
Fl et Alt-F2. Lorsqu'on place un shell a la priorite 10 sur Fun et 20 sur F autre, et quand on 
execute top -dl sur le second, on peut finalement lancer exempl e_boucl e sur un terminal, 
basculer vers F autre, et observer sa progression avec top qui continue de fonctionner. Comme 
c'est le noyau qui assure la commutation entre les terminaux virtuels et le dialogue avec eux, 
il n'y a plus de problemes d' ordonnancement. Nous avons enfin trouve un moyen de 
conserver la main, meme avec un processus temps-reel qui boucle. 

Si on desire travailler sous X-Window, on peut utiliser un serveur XI 1 fonctionnant sur une 
autre machine. Sinon, il faut passer le serveur en ordonnancement temps-reel. Pour cela, on 
invoque : 

$ . /exempl e_setscheduler 10 startx 
On ouvre un Xterm et on diminue la priorite du shell : 
$ . /exempl e_setscheduler 5 sh 

Le nouveau shell peut alors servir a lancer F application a deboguer ; on pourra toujours la 
tuer depuis un autre Xterm fonctionnant avec la priorite 10. 

Pour finir, precisons le prototype de l'appel-systeme sched _yield() dont nous avons deja 
parle, et qui permet a un processus de liberer volontairement le processeur. 

int sched_yield(void) ; 

Rappelons que le processus appelant ne sera remplace que par un autre, Pret, de meme prio- 
rite. Lordonnanceur n'elira jamais un processus de priorite inferieure. Quant a un eventuel 
processus de priorite superieure, il prendra automatiquement le controle des qu'il sera pret, 
sans que sched^yi el d( ) n'ait besoin d'etre invoque. Cet appel-systeme est en realite rarement 
utile. Dans Fordonnancement RR, il n'a pas lieu d'etre car la commutation se fait automati- 
quement au bout d'un certain delai ou si le processus s'endort. Dans Fordonnancement FIFO, 
deux processus de meme priorite ont un comportement plus difficile a prevoir, puisque la 
commutation intervient uniquement lorsque le processus en cours d'execution s'endort sur un 
appel-systeme bloquant. 

Lors d'un fork( ), Posix.lb mentionne que le processus pere doit continuer a s'executer avant 
son his. Si Fordonnancement est FIFO, le pere peut meme s'executer jusqu'a la fin sans que 
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son fils n'ait eu le temps de demarrer. Cela pose un serieux probleme si le fils doit basculer sur 
une priorite superieure a celle de son pere. On pourrait imaginer utiliser sched^yiel d( ) imme- 
diatement apres forkO pour donner la main au processus fils afin qu'il invoque sched_ 
setschedul er( ). Toutefois, ce fonctionnement est aleatoire car nous ne sommes pas sur que le 
processus fils soit pret immediatement (si le noyau doit envoyer des pages sur le peripherique 
de swap pour creer le contexte du nouveau processus par exemple), et le processeur peut etre 
reattribue immediatement au pere. 

II vaut mieux dans ce cas s'en tenir a ce qui est defini par Posix.lb, c'est-a-dire placer la 
modification de priorite dans le code du processus pere. On n'utilisera pas 

if ( (pid = forkO) < 0) 

erreur_fatale( ) ; 
if (pid == 0) { 

/* fils */ 

sched_setscheduler(0, SCHED_FIF0, &mes_parametres) ; 
/*...*/ 
} else { 

sched_yiel d( ) ; 
/* ... */ 

} 

mais plutot 

if ((pid = forkO) < 0) 

erreur_fatal e( ) ; 
if (pid == 0) { 

/* Fils */ 

/* ... */ 
} else { 

sched_setscheduler(pid, SCHED_FIF0, & parametres_fils) ; 
I* ... * I 

} 

Notons que le comportement de sched_setschedul er( ) est parfaitement defini par SUSv3 
lorsqu'on modifie la priorite d'un autre processus. Si ce dernier devient plus prioritaire que 
F appelant, il est execute immediatement, avant le retour de l'appel-systeme. 

Conclusion 

L' ordonnancement des processus est un domaine tres interessant et plus facile a apprehender 
qu'on pourrait le croire au premier abord. La presentation generale des principes d'un ordon- 
nanceur est decrite dans [TANENBAUM 1997] Operating Systems, Design and Implementa- 
tion. 

La description la plus complete des ordonnancements temps-reel est probablement celle 
qu'on trouve dans [GALLMEISTER 1995] Posix.4 Programming For The Real World. 
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Les threads representent un concept relativement nouveau dans le domaine de la programma- 
tion. II s'agit d'une maniere differente d'aborder la conception multitache. Linux implemente 
les mecanismes qui, mis en ceuvre par le noyau et des fonctions de bibliotheque, permettent 
d'acceder a la puissance des threads avec la portabilite de la norme SUSv3. 

Ces fonctionnalites etant standardises, elles ont donne naissance au terme Pthread pour 
representer les threads compatibles avec la norme Posix.lc qui les decrivait en premier lieu. 

Ce chapitre presentera les notions et les routines essentielles de la programmation multi- 
thread. Naturellement, nous ne pourrons pas inspecter en profondeur toutes les implications 
de ce mode de travail. Pour plus de details, notamment en ce qui concerne les conditions de 
synchronisation permettant d'eviter les blocages, on se reportera par exemple a [BUTENHOF 
1997] Programming with POSIX Threads 

Presentation 

Le mot thread peut se traduire par « fil d'execution », c'est-a-dire un deroulement particulier 
du code du programme qui se produit parallelement a d'autres entites en cours de progres- 
sion. Les threads sont generalement presentes en premier lieu comme des processus alleges 
ne reclamant que peu de ressources pour les changements de contexte. II faut ajouter a ceci un 
point important : les differents threads d'une application partagent un meme espace d'adres- 
sage en ce qui concerne leurs donnees. La vision du programmeur est d'ailleurs plus orientee 
sur ce dernier point que sur la simplicite de commutation des taches. 

En premiere analyse, on peut imaginer les threads comme des processus partageant les memes 
donnees statiques et dynamiques. Chaque thread dispose personnellement d'une pile et d'un 
contexte d'execution contenant les registres du processeur et un compteur d' instruction. Les 
methodes de communication entre les threads sont alors naturellement plus simples que les 
communications entre processus. En contrepartie, Faeces concurrentiel aux memes donnees 
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necessite une synchronisation pour eviter les interferences, ce qui complique certaines portions 
de code. 

Les threads definis par la norme SUSv3 sont independants de 1' implementation sous-jacente 
dans le systeme d' exploitation. Les applications sont done portables sur des systemes 
n'implementant pas la notion de processus ni leurs methodes de communication. 

Les threads ne sont interessants que dans les applications assurant plusieurs taches en paral- 
lele. Si chacune des operations effectuees par un logiciel doit attendre la fin d'une operation 
precedente avant de pouvoir demarrer, il est totalement inutile d'essayer une approche multi- 
thread. 

Implementation 

Pour implementer les fonctionnalites de la norme SUSv3, il existe essentiellement deux 
possibilites : 1' implementation dans l'espace du noyau, et celle dans Fespace de Futilisateur. 
En implementation noyau, chaque thread est vu individuellement par le noyau ; il s'agit 
approximativement d'un processus independant partageant son espace d'adressage avec les 
autres threads de la meme application. En implementation utilisateur, F application n'est 
constitute que d'un seul processus, et la repartition en differents threads est assuree par une 
bibliotheque independante du noyau. Chaque implementation a ses avantages et ses defauts : 



Point de vue 


Implementation 
dans l'espace du noyau 


Implementation 
dans l'espace de I'utilisateur 


Implementation des 
fonctionnalites SUSv3. 


Necessite la presence d'appels-systeme 
specifiques, qui n'existent pas necessaire- 
ment sur toutes les versions du noyau. 


Portable de systeme Unix en systeme Unix 
sans modification du noyau. 


Creation d'un thread. 


Necessite un appel-systeme. 


Ne necessite pas d'appel-systeme, est done 
moins couteuse en ressource que I'imple- 
mentation dans le noyau. 


Commutation entre 
deux threads. 


Commutation par le noyau avec change- 
ment de contexte. 


Commutation assuree dans la bibliotheque 
sans changement de contexte, est done 
plus legere. 


Ordonnancement 
des threads. 


Chaque thread dispose des memes res- 
sources CPU que les autres processus du 
systeme. 


Utilisation globale des ressources CPU 
limitee a celle du processus d'accueil. 


Priorites des taches. 


Chaque thread peut s'executer avec une 
priorite independante des autres, even- 
tuellement en ordonnancement temps-reel. 


Les threads ne peuvent s'executer qu'avec 
des priorites inferieures a celle du proces- 
sus principal. 


Parallelisme. 


Sur une machine SMP, le noyau peut repar- 
tir les threads sur differents processeurs et 
profiter ainsi du veritable parallelisme. 


Les threads sont condamnes a s'executer 
sur un seul processeur puisqu'ils sont conte- 
nus dans un unique processus. 



Sous Linux, F implementation usuelle est effectuee dans Fespace noyau a Faide de Fappel- 
systeme cloneO. Celui-ci est declare dans <sched.h> ainsi : 

int clone (int (* fonction) (void * arg), 

void * pile, int attributs, void * arg); 
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Cet appel-systeme est un genre de forkO grace auquel le processus fils partage Fespace 
d'adressage de son pere. Toutefois cette fonction ne concerne en principe jamais le program- 
meur applicatif, car une bibliotheque fournit les fonctionnalites SUSv3 que nous allons 
decrire dans le reste de ce chapitre. 

Jusqu'au noyau 2.4, la principale bibliotheque implementant les threads s'appelait Linux- 
Threads. Puissante, elle souffrait toutefois de quelques limitations, notamment en ce qui 
concerne la gestion des signaux. Depuis le noyau 2.6 une nouvelle bibliotheque a ete integree 
a la bibliotheque C : la NPTL {Native Posix Thread Library). En outre, le noyau offre un 
support nettement ameliore en ce qui concerne la creation et l'ordonnancement des threads. 

II existe d'autres implementations des Pthreads sous Linux, notamment PCthreads qui fonc- 
tionne dans l'espace utilisateur, mais elles sont moins repandues que NPTL. 

Pour employer les fonctionnalites de la bibliotheque NPTL, il faut inclure Fen-tete <pthread . h> 
dans les fichiers source, ajouter l'option -pthread sur la ligne de commande du compilateur 
gcc. Nous ajoutons ces options dans le fichier Ma kef i 1 e pour l'utiliser systematiquement avec 
tous les programmes de ce chapitre. 



L'option -pthread a deux effets principaux : lors de la compilation elle permet de choisir une implementation 
fonctionnant en contexte multithread pourtoutes les routines de la bibliotheque C que Ton invoque (c'etait le 
role de la constante symbolique _REENTRANT avant la NPTL). Pendant I'edition des liens, cette option 
s'assure que Ton utilise la bibliotheque implementant les fonctions de gestion des threads (ce que realisait 
l'option -1 pthread auparavant). 



Creation de threads 

II existe grosso modo des equivalents aux appels-systeme forkO, waitO et exitO, qui 
permettent dans un contexte multithread de creer un nouveau thread, d'attendre la fin de son 
execution, et de mettre fin au thread en cours. 

Un type opaque pthread_t est utilise pour distinguer les differents threads d'une application, 
a la maniere des PID qui permettent d' identifier les processus. Dans la bibliotheque NPTL, le 
type pthread_t est implemente sous forme d'un unsi gned 1 ong, mais sur d'autres systemes il 
peut s'agir d'une structure. On se disciplinera done pour employer systematiquement la fonc- 
tion pthread_equal ( ) lorsqu'on voudra comparer deux identifiants de threads. 

int pthread_equal (pthread_t thread_l, pthread_t thread_2); 

Cette fonction renvoie une valeur non nulle s'ils sont egaux. 

Lors de la creation d'un nouveau thread, on emploie la fonction pthread_create( ). Celle-ci 
donne naissance a un nouveau fil d' execution, qui va demarrer en invoquant la routine dont on 
passe le nom en argument. Lorsque cette routine se termine, le thread est elimine. Cette 
routine fonctionne done un peu comme la fonction main( ) des programmes C. Pour cette 
raison, le fil d'execution original du processus est nomme thread principal {main thread). 
Le prototype de pthread_create( ) est le suivant : 

int pthread_create (pthread_t * thread, pthread_attr_t * attributs, 
void * (* fonction) (void * argument), 
void * argument) ; 
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Le premier argument est un pointeur qui sera initialise par la routine avec Fidentifiant du 
nouveau thread. Le second argument correspond aux attributs dont on desire doter le nouveau 
thread. Ces attributs seront detailles dans la prochaine section. En general, on transmettra en 
second argument un pointeur NULL, car le thread recoit alors les attributs standard par defaut. 

Le troisieme argument est un pointeur representant la fonction principale du nouveau thread. 
Celle-ci est invoquee des la creation du thread et recoit en argument le pointeur passe en 
derniere position dans pthread_create( ). Le type de l'argument etant void *, on pourra le 
transformer en n'importe quel type de pointeur pour passer un argument au thread. On pourra 
meme employer une conversion explicite en i nt pour transmettre une valeur. Cet argument 
est generalement un numero permettant au thread de determiner le travail qu'il doit accomplir 
- en employant la meme fonction principale pour plusieurs threads -, mais cela peut aussi 
etre un pointeur sur une structure que le nouveau thread doit manipuler avant de se terminer. 

Cette routine renvoie zero si elle reussit et une valeur non nulle sinon, correspondant a l'erreur 
survenue. En effet, comme l'essentiel des fonctions de la bibliotheque NPTL, pthread_ 
create( ) ne remplit pas necessairement la variable globale errno 1 . 

Lorsque la fonction principale d'un thread se termine, celui-ci est elimine. Cette fonction doit 
renvoyer une valeur de type void * qui pourra etre recuperee dans un autre hi d'execution. II 
est aussi possible d'invoquer la fonction pthread_exit( ), qui met fin au thread appelant tout 
en renvoyant le pointeur void * passe en argument. On ne doit naturellement pas invoquer 
exit( ), qui mettrait fin a toute l'application et pas uniquement au thread appelant. 

void pthread_exit (void * retour); 

Lorsque cette routine est appelee, toutes les fonctions de nettoyage final que nous observe- 
rons ulterieurement sont invoquees dans Fordre inverse de leur enregistrement. 

Pour recuperet - la valeur de retour d'un thread termine, on utilise la fonction pthread_join( ). 
Celle-ci suspend l'execution du thread appelant jusqu' a la terminaison du thread indique en 
argument. Elle remplit alors le pointeur passe en seconde position avec la valeur de retour du 
thread fini. 

int pthread_join (pthread_t thread, void ** retour); 

Lorsqu'on desire employer une valeur de type entier comme code de retour, il est important 
de proceder en deux etapes pour la recuperet - depuis le type voi d *. Ceci permet de conserver 
la portabilite du programme, meme si la taille d'un voi d * est plus grande que celle d'un i nt. 
Nous rencontrerons cette situation dans les programmes d'exemples decrits ci-dessous. 

Dans certaines conditions, un thread peut etre annule par un autre thread, un peu a la maniere 
d'un processus qui peut etre tue par un signal. Dans ce cas, le thread termine n'a pu renvoyer 
de valeur, aussi la variable * retour prend-elle une valeur particuliere : PTHREAD_CANCEL. 
Cette constante ne peut pas correspondre a une adresse valide, pas plus qu'a la valeur NULL 
d'ailleurs. 

La fonction pthread_join( ) peut echouer si le thread attendu n'existe pas, s'il est detache, 
comme nous le verrons plus bas, ou si un risque de blocage se presente - par exemple si un 
thread demande a attendre sa propre fin. 



1. Les relations entre la bibliotheque Pthreads et la variable errno seront traitees plus loin en detail. 
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Nous pouvons deja employer ces fonctions pour ecrire un petit programme simpliste avec 
plusieurs fils d'execution incrementant un compteur jusqu'a ce qu'il atteigne 40, puis qui se 
termine. 

exemple_create.c : 

#include <pthread.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <stdio.h> 

#include <string.h> 

#include <unistd.h> 

#define NB_THREADS 5 

void * fn_thread (void * numero); 

static int compteur = 0; 

int 
main (void) 

{ 

pthread_t thread[NB_THREADS] ; 
int i; 
int ret; 



for (i = 0; i < NB_THREADS; i ++) 

if ((ret = pthread_create(& thread[i], 

NULL, 

fn_thread, 

(void *) i)) != 0) { 
fprintf (stderr, "Is", strerror(ret) ) ; 
exit(EXIT_ FAILURE); 

} 

while (compteur < 40) { 

fprintf (stdout, "main : compteur = %d \n", compteur); 
sleep(l) ; 

} 

for (i = 0; i < NB_THREADS; i ++) 
pthread_join(thread[i ] , NULL); 
return EXIT_SUCCESS; 

} 

void * 
fn_thread (void * num) 
{ 

int numero = (int) num; 
while (compteur < 40) { 

usl eep(numero * 100000); 

compteur ++; 

fprintf (stdout, "Thread %d : compteur = %d \n", 
numero, compteur); 

} 

pthread_exit(NULL) ; 
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Lors de son execution, ce programme montre bien l'enchevetrement des differents threads : 
$ ./exemple_create 



ma i n : 


compteur = 0 






Thread 


0 


compteur 


= 


1 


Thread 


0 


compteur 


= 


2 


Thread 


0 


compteur 


= 


3 


Thread 


0 


compteur 




4 


Thread 


0 


compteur 


= 


5 


Thread 


0 


compteur 


= 


6 


Thread 


0 


compteur 


= 


7 


Thread 


0 


compteur 


= 


8 


Thread 


0 


compteur 


= 


9 


Thread 


0 


compteur 


= 


10 


Thread 


0 


compteur 


= 


11 


Thread 


1 


compteur 


= 


12 


Thread 


0 


compteur 


= 


13 


Thread 


0 


compteur 


= 


14 


Thread 


0 


compteur 


= 


15 


Thread 


0 


compteur 


= 


16 


Thread 


0 


compteur 


= 


17 


Thread 


0 


compteur 


= 


18 


Thread 


0 


compteur 


= 


19 


Thread 


0 


compteur 


= 


20 


Thread 


0 


compteur 


= 


21 


Thread 


0 


compteur 


= 


22 


Thread 


2 


compteur 


= 


23 


Thread 


0 


compteur 


= 


24 


Thread 


1 


compteur 


= 


25 


Thread 


0 


compteur 


= 


26 


Thread 


0 


compteur 


= 


27 


Thread 


0 


compteur 


= 


28 


Thread 


0 


compteur 


= 


29 


Thread 


0 


compteur 


= 


30 


Thread 


0 


compteur 


= 


31 


Thread 


0 


compteur 


= 


32 


Thread 


0 


compteur 


= 


33 


Thread 


0 


compteur 


= 


34 


Thread 


3 


compteur 




35 


Thread 


0 


compteur 




36 


Thread 


0 


compteur 




37 


Thread 


1 


compteur 




38 


Thread 


0 


compteur 




39 


Thread 


0 


compteur 




40 


Thread 


4 


compteur 




41 


Thread 


2 


compteur 




42 


Thread 


1 


compteur 




43 


Thread 


3 


compteur 




44 



$ 

Cette application est tres mal concue, car les differents threads modifient la meme variable 
globale sans se preoccuper les uns des autres. Et c'est justement l'essence meme de la 
programmation multithread d'eviter ce genre de situation, comme nous le verrons dans les 
prochains paragraphes. 
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Le programme suivant n' utilise qu'un seul thread autre que le fil d' execution principal ; il 
s'agit simplement de verifier le comportement des fonctions pthread_join( ) et pthreacL 
exitO. Nous sous-traitons la lecture d'une valeur au clavier dans un fil d'execution secon- 
dare. Le fil principal pourrait en profiter pour realiser d'autres operations. 

exemplejoin.c : 

#include <pthread.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
#include <unistd.h> 

void * 

fn_thread (void * inutile) 
{ 

char chaine[128]; 
int i = 0; 

fprintf (stdout, "Thread : entrez un nombre :"); 
while (fgets(chaine, 128, stdin) != NULL) 
if (sscanf (chaine, "%d" , & i) != 1) 
fprintf (stdout, "un nombre SVP :"); 

el se 

break; 

pthread_exit( (void *) i); 



void * retour; 
pthread_t thread; 

if ((ret = pthread_create(& thread, NULL, fn_thread, NULL)) != 0) { 
fprintf (stderr, "£s\n", strerrort ret) ) ; 
exit(EXIT_FAILURE); 



Sans surprise, F execution se deroule ainsi : 

$ ./exemple_join 

Thread : entrez un nombre :4767 

main : valeur lue = 4767 

$ 



int 
main (void) 



i nt 
int 



1 ; 

ret; 



pthread_join(thread , & retour); 
if (retour != PTHREAD_CANCELED) { 
i = (int) retour; 

fprintf (stdout, "main : valeur lue = M\n", i); 



return(EXIT_SUCCESS); 
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On notera la methode correcte employee pour recuperer la valeur de retour dans l'appel 
pthreacLjoi n( ), en utilisant d'abord un pointeur void * temporaire, qu'on transforme ensuite 
en i nt. 

Lorsqu'un thread ne renvoie pas de valeur interessante et qu'il n'a pas besoin d'etre attendu 
par un autre thread, on peut employer la fonction pthread_detach( ), qui lui permet de dispa- 
raitre automatiquement du systeme quand il se termine. Cela autorise la liberation immediate 
des ressources internes a la bibliotheque concernant ce thread (pile et variables automati- 
ques). Le mecanisme n'est pas sans rappeler le passage des processus a l'etat Zombie en 
attendant qu'on lise leur code de retour et l'emploi de S I G_ I G N pour le signal SIGCHLD du 
processus parent. 

int pthread_detach (pthread_t thread); 

Un thread peut tres bien invoquer pthread_detach( ) a propos d'un autre thread de l'applica- 
tion. Contrairement aux processus, il n'y a pas de notion de hierarchie chez les threads ni 
d'autorisations particulieres pour modifier les parametres d'un autre fil d' execution. Cette 
fonction echoue si le thread n'existe pas ou s'il est deja detache. 

II n'est pas possible d'attendre, avec pthread_joi n( ), la fin d'un thread donne parmi tous 
ceux qui se deroulent. Ce genre de fonctionnalite pourrait etre utile pour attendre que tous les 
threads d'un certain ensemble se terminent. On peut obtenir le meme resultat en utilisant des 
threads detaches qui decrementent un compteur global avant de se terminer, le thread prin- 
cipal surveillant alors l'etat de ce compteur. Des precautions devront etre prises pour Faeces 
au compteur global, comme nous le verrons plus tard. 

Pour connaitre son propre identifiant, un thread invoque la fonction pthread_sel f ( ), qui lui 
renvoie une valeur de type pthread_t : 

pthread_t pthread_sel f (void); 

II lui est alors possible de comparer, avec pthead_equal ( ), son identite avec une variable globale 
indiquant une tache a accomplir. Ainsi un programme peut utiliser ce genre de principe : 

static pthread_t thr_dialogue_radar; 

static pthread_t thr_dialogue_automate; 

static pthread_t thr_dialogue_radar_2; 

int 
main (void) 
{ 

pthread_create (& thr_dialogue_radar, NULL, dialogue, NULL); 
pthread_create (& thr_dialogue_automate, NULL, dialogue, NULL); 
pthread_create (& thr_dialogue_radar_2, NULL, dialogue, NULL); 
[...] 

} 

void * 

dialogue (void * inutile) 
{ 

initial isation_general e_dial ogue( ) ; 

if (pthread_equal (pthread_sel f ( ) , thr_dialogue_radar)) 

initial i sation_specif ique_radar( ) ; 
else if (pthread_equal (pthread_sel f ( ) , thr_dialogue_automate) ) 

initial i sation_specif ique_automate( ) ; 
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else if (pthread_equal (pthread_sel f ( ) , thr_dialogue_radar_2)) 
initial isation_specifique_radar_2( ) ; 

Dans ce cas precis, on aurait avantageusement obtenu le meme resultat en utilisant 1' argument 
de la fonction dialogueO. Toutefois, l'interet de la comparaison avec une variable globale 
pthread_t est de permettre d'adapter le comportement au sein de sous-routines profondement 
imbriquees, jusqu'auxquelles on ne desire pas faire descendre Fargument de di al ogue( ). 

Rappelons-nous que le type pthreadj est opaque et ne permet pas d'affectation directe. II 
n'est done pas possible de memoriser l'identifiant du thread principal, puisqu'il n'est pas cree 
par pthread_create( ). Si on en a besoin, il faut proceder en creant quand meme un thread 
nouveau : 

pthread_t thr_principal ; 

int 
main (void) 

{ 

void * retour; 

pthread_create(& thr_principal , NULL, suite_application, NULL); 
pthread_join(thr_principal , & retour); 
return(O'nt) retour); 

} 



void * 

suite_appl ication (void * inutile) 

{ 

[...] 

pthread_exit((void *) 0); 

} 



Attributs des threads 

Chaque thread est dote d'un certain nombre d'attributs, regroupes dans un type opaque 
phtread_attr_t. Les attributs sont fixes lors de la creation du thread grace au second argu- 
ment de pthread_create( ). Lorsque les attributs par defaut sont suffisants, on passe generale- 
ment un pointeur NULL sur cet argument. Sinon, il faut passer un pointeur sur un objet 
pthread_attr_t qui aura ete prealablement configure correctement. 

Dans un premier temps, il faut invoquer la fonction pthread_attr_init( ) en lui transmettant 
un pointeur sur une variable de type pthread_attr_t. Cette fonction peut servir - dans 
d'autres implementations que celle de Linux - a allouer des zones de memoire au sein du type 
opaque pthread_attr_t, aussi est-il indispensable de l'invoquer avant d'utiliser les attributs. 

int pthread_attr_init (pthread_attr_t * attributs); 

Une fois les attributs initialises, on utilise les fonctions pthread_attr_getXXX( ) et pthread_ 
attr_setXXX( ) pour consulter ou changer Fattribut correspondant. Les attributs vont etre decrits 
ci-dessous. Lobjet de type pthread_attr_t est alors pret a etre utilise dans pthread_create( ). 
Le thread cree est configure en fonction des attributs indiques, et l'objet pthread_attr_t peut 
etre a nouveau modifie pour preparer la creation d'un autre thread. Une fois qu'on n'en a plus 
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besoin, cet objet peut etre detruit en employant la fonction pthread_attr_destroy ( ), qui peut 
liberer des donnees dynamiques internes. L'invocation de cette fonction est done indispensable 
pour assurer la portabilite du programme, meme si elle n'a pas d'utilite dans l'implementa- 
tion NPTL actuelle. Les threads crees precedemment ne sont pas concernes par la destruction 
de l'objet attribut, ce dernier a ete utilise une fois pour toutes au moment de la creation du 
thread, mais n'a plus de liaison avec lui. 

int pthread_attr_destroy (pthread_attr_t * attributs); 

Les fonctions permettant done de modifier un attribut ou de lire sa valeur se nomment pthread_ 
attr_setXXX( ) et pthread_attr_getXXX( ), le XXX indiquant l'attribut concerne. Ces fonctions 
prennent un pointeur sur un objet pthread_attr_t en premier argument. Le second argument 
est une valeur pour les fonctions pthread_attr_setXXX( ), et un pointeur sur une valeur pour 
les routines pthread_attr_getXXX( ). La valeur de l'attribut est generalement un entier, mais il 
existe quelques exceptions. Nous allons faire une presentation rapide des fonctions de confi- 
guration des attributs. Si la valeur indiquee pour l'attribut n'est pas acceptable, la fonction 
echoue avec l'erreur EINVAL. 

Rappelons que ces fonctions permettent uniquement de configurer un ensemble d' attributs en 
vue de les transmettre a pthread_create( ). II n'est pas possible d'employer ces routines pour 
modifier les attributs concernant un thread deja cree. 

L'attribut detachstate correspond au detachement du thread avant son demarrage. Nous 
avons deja vu que pthread_detach( ) permet de le modifier de maniere dynamique. 

int pthread_attr_getdetachstate (const pthread_attr_t * attributs, 

int * valeur) ; 

int pthread_attr_setdetachstate (pthread_attr_t * attributs, 

int valeur); 

La valeur de cet attribut, disponible dans toutes les implementations Posix.lc, peut consister 
en l'une des constantes symboliques suivantes : 



Nom 


Signification 


PTHREAD_CREATE_JOINABLE 


Configuration par defaut, la valeur de retour du thread sera conservee jusqu'a ce 
qu'elle soit consultee par un autre thread. 


PTHREAD_CREATE_DETACHED 


Lors de la terminaison du thread, toutes ses ressources sont liberties immediate- 
ment, il n'y a pas de valeur de retour valide. 



Les attributs stackaddr et stacksize permettent de configurer la pile utilisee par un thread. 
Comme nous l'avons deja indique, chaque thread dispose d'une pile personnelle, dans 
laquelle sont allouees toutes ses variables automatiques. II peut etre parfois necessaire de 
reclamer une pile de dimension plus grande que celle qui est fournie par defaut si le thread a 
creer fait un large usage de fonctions recursives, par exemple. 

A F inverse, il peut etre necessaire de reduire la taille de la pile accordee a un thread. Par 
defaut, la NPTL emploie des piles de 8 Mo, ce qui est bien souvent tres superieur aux besoins 
des threads, et ce qui limite le nombre de threads utilisables (de l'ordre de 256 threads). En 
reduisant la taille de la pile a 16 Ko, on peut employer plusieurs milliers, voire dizaines de 
milliers de threads. 
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Comme nous le verrons dans le prochain chapitre, la pile d'un processus habituel n'est 
contrainte que par la limite de la zone nominee tas, dans laquelle les variables dynamiques 
sont allouees. En principe, la pile d'un tel processus pourrait croitre jusqu'a remplir l'essen- 
tiel de l'espace d'adressage du programme, soit environ 3 Go. Dans le cas d'un programme 
multithread, les differentes piles doivent etre positionnees a des emplacements figes des la 
creation des threads, ce qui impose ipso facto des limites de taille puisqu'elles ne doivent pas 
se rejoindre. 

Les routines citees ci-dessous permettent respectivement de lire ou d'indiquer l'adresse de 
depart et la taille maximale de la pile du thread. Elles sont disponibles dans la bibliotheque 
Pthreads si les constantes symboliques _POSIX_THREAD_ATTR_STACKADDR et _POSIX_THREAD_ 
ATTR_STACKSIZE sont definies dans <uni std. h>. La dimension minimale de la pile est dispo- 
nible dans la constante symbolique PTHEAD_STACK_MIN (16 Ko sur PC sous Linux). 

Naturellement, l'emploi de ces attributs est assez pointu, et on le reservera aux applications 
pour lesquelles ils sont reellement indispensables. 

int pthread_attr_getstackaddr (const pthread_attr_t * attributs, 

void ** val eur) ; 
int pthread_attr_setstackaddr (pthread_attr_t * attributs, 

void * valeur); 

int pthread_attr_getstacksize (const pthread_attr_t * attributs, 

size_t * valeur) ; 
int pthread_attr_setstacksize (pthread_attr_t * attributs, 

size_t valeur); 

Les attributs schedpol icy, schedparam, scope et inheritsched concernent l'ordonnancement 
des threads. Ils sont disponibles si la constante symbolique _POSIX_THREAD_PRIORITY_SCHEDU- 
LING est definie avec une valeur vraie dans <uni std . h>. 

int pthread_attr_getschedpolicy (const pthread_attr_t * attributs, 

int * valeur); 

int pthread_attr_setschedpolicy (pthread_attr_t * attributs, int valeur); 

L'attribut schedpol icy correspond a la methode d'ordonnancement employee pour le thread. 
Les valeurs possibles sont semblables a celles qui ont deja ete etudiees au chapitre precedent, 
avec l'appel-systeme sched_setschedul er( ) : 



Norn Signification 

SCHED_OTHER Ordonnancement classique 

SCHED_RR Sequencement temps-reel avec I'algorithme Round Robin 

SCHED_FIFO Ordonnancement temps-reel FiFO 



On peut aussi employer la fonction pthread_setschedparam( ) que nous verrons ci-dessous 
pour modifier la politique de sequencement apres creation du thread. Les ordonnancements 
temps-reel necessitent un UID effectif nul, sinon la fonction pthread_create( ) echouera avec 
Perreur EPERM. 
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L'attribut schedparam contient principalement la priorite du processus, telle que nous l'avons 
vue dans le chapitre precedent. 

int pthread_attr_getschedparam (const pthread_attr_t * attributs, 

struct sched_param * params); 
int pthread_attr_setschedparam (pthread_attr_t * attributs, 

const struct sched_param * params); 

L'attribut schedparam, qui ne concerne que les ordonnancements temps-reel (RR et FIFO), 
ainsi que l'attribut schedpolicy peuvent etre consultes ou modifies durant l'execution du 
thread a l'aide des fonctions pthread_setschedparam( ) et pthread_getschedparam( ) : 

int pthread_setschedparam (pthread_t thread, 

int ordonnancement, 

const struct sched_param * params); 
int pthread_getschedparam (pthread_t thread. 

int * ordonnancement, 

struct sched_param * params); 

L'attribut scope n'est pas vraiment configurable avec la bibliotheque NPTL. II sert dans les 
implementations hybrides reposant en partie sur un ordonnancement par le noyau - comme 
c'est le cas sous Linux - et en partie sur une bibliotheque dans l'espace utilisateur. Dans ce 
cas, cet attribut peut prendre l'une des valeurs suivantes : 



Norn 


Signification 


PTHREAD_SCOPE_SYSTEM 


Cette valeur reclame un ordonnancement du thread en concurrence avec tous les 
processus du systeme. Le sequenceur utilise est done celui du noyau. 


PTHREAD_SCOPE_PR0CESS 


Non supporte avec NPTL, cet ordonnancement oppose les threads les uns aux autres , 
au sein du meme processus. 



L'attribut scope est done relatif aux priorites des threads : dans un cas vis-a-vis du systeme, et 
dans 1' autre cas, interne au processus qui les accueille. 

int pthread_attr_getscope (const pthread_attr_t * attributs, 

int * valeur); 

int pthread_attr_setscope (pthread_attr_t * attributs, int valeur); 
Sous Linux, l'invocation 

pthread_attr_setscope (& attributs, PTHREAD_SCOPE_PROCESS) ; 
echoue avec l'erreur ENOTSUP. 

Finalement, l'attribut inheritsched signale si le thread dispose de sa propre configuration 
d' ordonnancement, comme c'est le cas par defaut, ou si les attributs schedparam et sched- 
pol icy sont ignores, au profit de 1' ordonnancement du thread qui l'a cree. Les valeurs de cet 
attribut peuvent etre : 



Norn 


Signification 


PTHREAD_EXPLICIT_SCHED 


Lordonnancement est specifique au thread cree (par defaut). 


PTHREAD_INHERIT_SCHED 


Lordonnancement est herite du thread createur. 
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int pthread_attr_getinheritsched (const pthread_attr_t * attributs, 

int * valeur) ; 

int pthread_attr_setinheritsched (pthread_attr_t * attributs, int valeur); 

Deroulement et annulation d'un thread 

Un thread peut vouloir annuler un autre thread. II envoie alors une demande d' annulation, qui 
sera prise en compte ou non, en fonction de la configuration du thread recepteur. Lorsqu'un 
thread est annule, il se comporte exactement comme s'il invoquait la fonction pthread_exi t( ) 
avec l'argument special PTHREAD_CANCELED. Lorsque le thread annule se termine, il execute 
toutes les fonctions de terminaison programmees, comme nous le verrons plus bas. 

Le thread recepteur peut accepter la requete, la refuser ou la repousser jusqu'a atteindre un 
point d' annulation dans son execution. Pour envoyer une demande d' annulation, on emploie 
la fonction pthread_cancel (), qui renvoie 0 si elle reussit, ou l'erreur ESRCH si le thread vise 
n'existe pas ou plus. 

| int pthread_cancel (pthread_t thread); 

La suppression d'un thread est un phenomene assez subtil. On y a recours generalement 
lorsqu'un thread n'a plus d'interet parce qu'on a obtenu par un autre moyen le resultat qu'il 
devait fournir, ou apres un abandon demande par l'utilisateur. Prenons l'exemple d'une appli- 
cation recherchant un nombre qui verifie certaines proprietes 1 . Elle peut, pour tirer profit du 
parallelisme d'une machine multiprocesseur, scinder son espace de recherche en plusieurs 
portions et declencher une serie de threads, chacun explorant sa portion personnelle. Aussitot 
qu'un thread aura trouve la valeur recherchee, on pourra annuler ses confreres. 

Toutefois, un thread manipule souvent des variables globales en employant des techniques de 
verrouillage que nous etudierons dans les prochains paragraphes. S'il se trouve annule bruta- 
lement au moment de la mise a jour d'une variable globale, il peut la laisser dans un etat 
instable ou abandonner un verrou en position bloquee. II faut done pouvoir interdire tempo- 
rairement les demandes d' annulation dans certaines portions du code. 

La fonction pthread_setcance1state() permet de configurer le comportement du thread 
appelant vis-a-vis d'une requete d' annulation. 

int phtread_setcancel state (int etat_annulation, int * ancien_etat) ; 

Les valeurs possibles sont les suivantes : 



Norn 


Signification 


PTHREAD_CANCEL_ENABLE 


Le thread acceptera les requetes d'annulation (comportement par defaut). 


PTHREAD CANCEL DISABLE 

1 


Le thread ne tiendra pas compte des demandes d'annulation. 



Les requetes d'annulation ne sont pas memorisees, contrairement aux signaux par exemple, 
ce qui fait d'un thread desactivant temporairement les requetes pendant une zone de code 
critique ne se terminera pas lorsqu'il autorisera de nouveau les annulations, meme si plusieurs 
demandes sont arrivees pendant ce laps de temps. 



1. On peut imaginer par exemple la recherche par la force brute d'une cle de decryptage d'un message. 
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II faut done trouver un moyen plus souple pour empecher Fannulation de se produire intem- 
pestivement, tout en acceptant les requetes. Pour cela, on utilise tout simplement un meca- 
nisme de synchronisation fonde sur un retardement des annulations jusqu'a atteindre des 
emplacements bien definis du code. 

Le thread ainsi configure ne se terminera pas des la reception d'une annulation, mais conti- 
nuera de s'executer jusqu'a atteindre un point d'annulation - que nous allons definir ci- 
dessous. Pour configurer ce comportement, on emploie la fonction pthread_setcanceltype( ) 
dont le prototype est : 

int phtread_setcancel type (int type_annulation, int * ancien_type) ; 

Le type d'annulation peut correspondre a l'une des constantes suivantes : 



Norn 


Signification 




PTHREAD_CANCEL_DEFERRED 


Le thread ne se terminera qu'en atteignant un point d'annulation 
(comportement par defaut). 




PTHREAD_CANCEL_ASYNCHRONOUS 


L'annulation prendra effet des reception de la requete. 






La norme SUSv3 decrit quatre fonctions qui constituent des points d'annulation, e'est-a-dire 
des fonctions dans lesquelles un thread est susceptible de se terminer brutalement : 

pthread_cond_wait( ) et pthread_cond_timedwait( ) que nous verrons dans un prochain para- 
graphe. 

pthread_joi n( ) que nous avons deja examinee. 

pthread_testcancel ( ). 

Cette derniere fonction est declaree ainsi : 

void pthread_testcancel (void); 

Des qu'on l'invoque, le thread peut se terminer si une demande d'annulation est en attente. 
On voit done que dans le cas PTHREAD_CANCEL_DEFERRED, un thread ne sera jamais interrompu 
au milieu d'un calcul ou dans une boucle de manipulation des donnees. On pourra done 
repartir des appels pthread_testcancel ( ) dans ce genre de code, aux endroits oil on est sur 
qu'une annulation ne presente pas de danger. 

II existe aussi dans SUSv3 un ensemble minimal d'appels-systeme qui representent des 
points d'annulation sur toutes les implementations des Pthreads (certains de ces appels sont 
optionnels dans SUSv3 et ne sont pas implemented sous Linux) : 

• acceptO, ai o_suspend( ), 

• cl ockjianosl eep( ), cl ose( ), connect ( ) , create ), 

• f cntl ( ), fsync( ), 

• getmsg( ), getpmsg( ), 

• lockfO, 

• mqreceive( ), mqsend( ), mq_timed_receive( ), mq_timed_send( ), msqrcv( ), msqsndC ), msync( ), 

• nanosleepO, 
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• openO, 

• pa use ( ), pol 1 ( ), pread( ), psel ect( ), putms g ( ), putpmsg( ), pwriteO, 

• readO, readvO, recvO, recvfromO, recvmsgO, 

• selectO, sem_timedwai t( ), sem_waitO, sendO, sendmsgO, sendtoO, sigpauseO, 
sigsuspend( ), sigtimedwait( ), sigwait( ), sigwaitinfo( ), sleep( ), system( ), 

• tcdrainO, 

• usleepO, 

• waitO, waiti d(), waitpidO, write (), writevO. 

Ces fonctions ont en commun de pouvoir bloquer indefiniment, ce qui represente un gachis de 
ressource si le thread doit etre annule. II existe aussi un nombre important de routines qui 
peuvent etre des points d'annulation, si leurs concepteurs le desirent. On consultera a cet effet 
la documentation Gnu pour connaitre les fonctions de bibliotheques concernees. 

Un grand nombre de fonctions et d'appels-systeme modifient temporairement des donnees 
statiques et ne peuvent pas se permettre d'etre interrompus n'importe quand. Cela signifie 
qu'un appel-systeme lent, comme readO, ne doit jamais etre invoque si le thread est confi- 
gure avec une annulation asynchrone. Les fonctions qui supportent l'annulation asynchrone 
(async-cancel safe) sont explicitement documentees comme telles. Etant donne qu'elles sont 
extremement rares, on se fixera comme regie de ne configurer un thread en mode d'annulation 
asynchrone que pour des portions de code oil il realise des boucles de calculs intenses, sans 
aucun appel-systeme. 

En resume, on utilisera principalement les configurations suivantes : 





Configuration 


Utilisation 


PTHREAD 


_CANCEL_DISABLE 


Zone critique ou Ton ne peut supporter aucune annulation, meme si on invoque 
un appel-systeme. 


PTHREAD 
PTHREAD 


_CANCEL_ENABLE 
_CANCEL_DEFERRED 


Comportement habituel des threads. 


PTHREAD 
PTHREAD 


_CANCEL_ENABLE 
_CANCEL_ASYNCHRONOUS 


Boucle de calculs gourmande en CPU, sans appel-systeme. 



Comme un thread peut etre legitime ment annule pratiquement a n'importe quel moment, il 
convient de trouver un moyen de liberer les ressources qu'il peut maintenir, avant qu'il se 
termine vraiment. En effet, quant un thread disparait, la memoire dynamique qu'il s'etait 
allouee n'est pas liberee automatiquement par le noyau, contrairement a la fin d'un processus. 
Le meme probleme se pose avec les fichiers ouverts, les tubes de communication, les sockets 
reseau... De plus, un thread peut avoir verrouille une ou plusieurs ressources partagees, afin 
d'en avoir temporairement l'usage exclusif, et il convient de relacher les verrous poses. 

Pour cela, la norme SUSv3 propose un mecanisme assez elegant, bien qu'un peu surprenant a 
premiere vue. Lorsqu'un thread s'attribue une ressource - memoire, fichier, verrous, etc. - 
qui necessitera une liberation ulterieure, il enregistre le nom d'une routine de liberation dans 
une pile speciale, avec la fonction pthread_cleanup_push( ). Lorsque le thread se termine, les 
routines sont depilees - dans l'ordre inverse de leur enregistrement - et executees. 
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Quand un thread desire liberer explicitement une ressource, a la fin d'une fonction par 
exemple, il appelle pthread_cleanup_pop( ), qui extrait la derniere routine enregistree et 
l'invoque. Les prototypes de ces deux fonctions sont les suivants : 

void pthread_cl eanup_push (void (* fonction) (void * argument), 

void * argument) ; 
void pthread_cl eanup_pop (int execution_routine) ; 

La routine pthread_cl eanup_push ( ) prend done en premier argument un pointeur de fonction, 
et en second un pointeur generique pouvant representer n'importe quel objet. Lorsque la 
routine de nettoyage est appelee, elle recoit en argument le second pointeur. En general, on 
utilisera 

FILE * fp; 

fp = fopen(nom_fichier, "r"); 
pthread_cl eanup_push(fcl ose, fp) ; 

ou 

char * buffer; 

buffer = malloc(BUFSIZE); 

pthread_cleanup_push(free, buffer) ; 

ou encore 

int fd; 

fd = open(nom_fichier, 0_RD0NLY) ; 
pthread_cleanup_push(close, (void *) fd); 

Lorsqu'on desire invoquer explicitement la routine de liberation, on emploie pthread_ 
cl eanup_pop( ) en lui passant un argument entier. Si cet argument est nul, la routine est retiree 
de la pile de nettoyage, mais elle n'est pas executee. Sinon, la routine est extraite et invoquee. 

Ce mecanisme necessite done de soigner la conception du programme pour disposer les allo- 
cations et liberations autour des zones oil le thread peut etre annule. On se disciplinera pour 
adopter ce comportement dans toutes les fonctions de F application. En employant par exemple : 

void 

routine_dialogue (char * nom_serveur, char *nom_fichier_enregistrement) 
{ 

char * buffer; 

FILE * fichier; 

int socket_serveur; 

int nb_octets_recus ; 



buffer = malloc(BUFSIZE); 
if (buffer != NULL) { 

pthread_cleanup_push(free, buffer) ; 



socket_serveur = ouverture_socket(nom_serveur) ; 
if (socket_serveur >= 0) { 

pthread_cleanup_push(close, (void *) socket_serveur) ; 

fichier = fopen(nom_fichier_enregistrement, "w"); 
if (fichier != NULL) { 

pthread_cleanup_push(fclose, fichier) ; 
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while (1) { 

nb_octets_recus = lecture_socket(socket_serveur, 



buffer) ; 



if (nb_octets_recus < 0) 



break; 

if (fwritetbuffer, 1, nb_octets_recus , fichier) 



!= nb_octets_recus) 



break; 



pthread_cleanup_pop(l) ; /* fclose(fichier) */ 



pthread_cleanup_pop(l) ; /* close(socket_serveur) */ 



pthread_cleanup_pop(l) ; /* free(buffer) */ 



Pour obliger le programmeur a adopter un comportement coherent dans toute la fonction, la 
norme SUSv3 impose une contrainte assez restrictive a l'utilisation de ces routines. En effet, 
les appels pthread_cl eanup_push( ) et pthread_cl eanup_pop( ) doivent se trouver dans la 
meme fonction et dans le meme bloc lexical. Cela signifie qu'ils doivent etre au meme niveau 
d'imbrication entre accolades. On peut le verifier d'un coup d'ceil en s'assurant que le 
pthread_cl eanup_pop( ) se trouve bien au meme niveau d'indentation que le pthread_cl eanup_ 
push( ) correspondant. 

Pour comprendre la raison de cette restriction, il suffit de savoir que F implementation de ces 
routines dans la plupart des bibliotheques, dont NPTL, est realisee par deux macros : la 
premiere comprend une accolade ouvrante alors que la seconde contient 1' accolade fermante 
associee. II importe done de considerer ces deux fonctions comme une paire d' accolades et de 
ne pas essayer de les separer de plus d'un bloc lexical. 

On prendra comme habitude de faire systematiquement suivre un appel de la fonction 
pthread_cl eanup_pop( ) d'un commentaire indiquant son effet, comme on peut le voir ci- 
dessus. On remarquera egalement que le fait de n'avoir plus qu'un seul point de sortie d'une 
routine oblige parfois a une indentation excessive. Pour eviter ce probleme, on peut scinder la 
routine en plusieurs sous-fonctions ou utiliser des sauts goto, comme e'est souvent l'usage 
pour les gestions d'erreur. Dans ce cas, le programme precedent deviendrait : 



routine_dialogue (char * nom_serveur, char *nom_fichier_enregistreinent) 

{ 

char * buffer; 

FILE * fichier; 

int socket_serveur; 

int nb_octets_recus ; 

if ((buffer = malloc(BUFSIZE))== NULL) 
return; 

pthread_cl eanup_push(f ree, buffer) ; 

if ( (socket_serveur = ouverture_socket(nom_serveur) ) < 0) 

goto sortie_cleanup_l; 
pthread_cleanup_push(close, (void *)socket_serveur) ; 



void 
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if ((fichier = fopen(nom_fichier_enregistrement, "w")) == NULL) 

goto sortie_cleanup_2; 
pthread_cleanup_push(fclose, fichier) ; 

while (1) { 

nb_octets_recus = lecture_socket(socket_serveur, buffer); 
if (nb_octets_recus < 0) 
break; 

if (fwrite(buffer, 1, nb_octets_recus , fichier) 
!= nb_octets_recus) 
break; 

} 

pthread_cleanup_pop(l) ; /* fclose(fichier) */ 
sortie_cleanup_2 : 

pthread_cleanup_pop(l) ; /* cl ose(socket_serveur) */ 
sortie_cleanup_l : 

pthread_cleanup_pop(l) ; /* free(buffer) */ 

} 

Ce genre de code est peut-etre moins elegant, mais il est particulierement bien adapte a ce 
type de gestion d'erreur. On rencontre de frequents exemples d'emploi de goto dans ce 
contexte au sein des sources du noyau Linux. 

A 1' oppose des routines de nettoyage en fin de thread, on a souvent besoin, dans un module 
d'une application, d'initialiser des donnees au debut de leur mise en ceuvre. Imaginons un 
module servant a interroger une base de donnees. II doit dissimuler au reste du programme 
1' implementation interne. Que la base de donnees soit representee par un fichier local, un 
demon fonctionnant en arriere-plan ou un serveur distant accessible par le reseau, le module 
doit adopter la meme interface vis-a-vis du reste du programme. II existe ainsi une routine 
publique d' interrogation susceptible d'etre appelee par differents threads, eventuellement de 
maniere concurrente, gerant done Faeces critique aux donnees partagees avec des meca- 
nismes decrits dans les prochains paragraphes. 

Toutefois il est necessaire, lors de la premiere interrogation, d'etablir la liaison avec la base 
de donnees proprement dite - ouvrir le fichier, acceder au tube de communication avec le 
demon, contacter le serveur distant -, ce qui ne doit etre realise qu'une seule fois. On verifiera 
done a chaque interrogation si l'initialisation a bien eu lieu. La bibliotheque Pthreads propose 
une fonction pthread_once( ) qui remplit ce role en s'affranchissant des problemes de 
synchronisation si plusieurs threads Finvoquent simultanement. 

Pour utiliser cette fonction, il faut prealablement definir une variable statique de type pthread_ 
once_t, initialisee avec la constante PTHREAD_ONCE_INIT, qu'on passera par adresse a la routine 
pthread_once( ). Le second argument est un pointeur sur une fonction d'initialisation qui ne 
sera ainsi appelee qu'une seule fois dans F application. 

int pthread_once (pthread_once_t * once, void (* fonction) (void)); 

En poursuivant notre exemple concernant un module de dialogue avec une base de donnees, 
on obtiendrait : 

void initialisation_dialogue_base (void); 
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int 

interrogation_base_donnees (char * question) 

{ 

static pthread_once_t once_initial isation = PTHREAD_ONCE_I NIT ; 

pthread_once(& once_initial isation, initialisation_dialogue_base) ; 
[...] 

} 

Naturellement, seule la premiere invocation de pthread_once( ) a un effet, les appels ulte- 
rieurs n'ayant plus aucune influence. 

On peut se demander ce qui se passe lorsqu'un thread appelle fork( ). Le comportement est 
tout a fait logique. Le processus entier est duplique, y compris les zones de memoire parta- 
gees avec les autres threads. Par contre, il n'y a dans le processus fils qu'un seul fLl d'execu- 
tion, celui du thread qui a invoque fork( ), cela quel que soit le nombre de threads concurrents 
avant la separation. 

Un premier probleme se pose, car les piles et les zones de memoire dynamiquement allouees 
par les autres threads continuent d'etre presentes dans l'espace memoire du nouveau 
processus, meme s'il n'a aucun moyen d'y acceder. Aussi, en theorie ce mecanisme doit etre 
restreint uniquement a Futilisation de exec( ) apres le fork( ). 

Un second probleme peut se poser si un autre thread a verrouille - dans le processus pere - 
une ressource. Si le thread restant dans le processus fils a besoin de cette ressource, celle-ci 
persiste a etre verrouillee, et on risque un blocage definitif. 

Pour resoudre ce probleme, il existe une fonction nommee pthread_atfork( ), qui permet 
d'enregistrer des routines qui seront automatiquement invoquees si un thread appelle fork( ). 
Les fonctions sont executees dans Fordre inverse de leur enregistrement, comme avec une 
pile. La liste des fonctions memorisees est commune a tous les threads. 

On peut enregistrer trois fonctions avec pthread_atfork( ). La premiere routine est appelee 
avant le fork( ) dans le thread qui F invoque. Les deux autres routines sont appelees apres la 
separation, Fune dans le processus fils, et l'autre dans le processus pere - toujours au sein du 
thread ayant invoque fork( ). 

int pthread_atfork (void (* avant) (void), 

void (* dans_pere) (void), 
void (* dans_fils) (void)); 

Si un pointeur est nul, la routine est ignoree. Nous allons voir dans le prochain paragraphe 
comment bloquer ou liberer des verrous pour Faeces a des zones critiques. Dans Fencadre- 
ment de fork( ), on essaye d'eviter la situation suivante : 

1. Le thread numero 1 bloque un verrou pour acceder a une zone de donnees. 

2. Le thread numero 2 appelle fork( ), dupliquant Fensemble de l'espace memoire du proces- 
sus, y compris le verrou bloque. 

3. Le processus pere continue de se derouler normalement, le thread 1 liberant le verrou apres 
ses modifications, et le thread 2 pouvant poursuivre son execution. 

4. Dans le processus fils, le thread 2 veut acceder a la zone de donnees commune. Celle-ci 
etant verrouillee, il attend que le thread 1 libere le verrou, mais il n'y a pas de thread 1 dans 
le fils ! Le processus est definitivement bloque. 
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La bonne maniere de proceder est la suivante, un peu complexe mais correcte : 

1. Avant que le thread 1 bloque le verrou - par exemple pendant son initialisation-, on 
installe la routine avantt ) , qui correspond a un blocage du verrou, ainsi que dans_pere( ) 
et dans_f i 1 s ( ) , deux routines qui representent une liberation du verrou. 

2. Le thread numero 1 bloque le verrou. 

3. Le thread numero 2 appelle fork( ). La routine avantO est invoquee. Correspondant a une 
demande de blocage du verrou, elle reste bloquee jusqu'a ce que le thread 1 ait termine son 
travail. 

4. Le thread numero 1 libere le verrou. 

5. La routine avant ( ) bloque le verrou et se termine. 

6. L'appel-systeme fork( ) a lieu, les processus se separent. Les routines dans_pere( ) et dans_ 
f i 1 s ( ) sont invoquees, liberant le verrou dans les deux contextes. 

7. Les threads 1 et 2 du processus pere continuent normalement. 

8. Le thread 2 du processus fils peut acceder a la zone de donnees s'il le desire, le verrou est 
libre. 

Nous voyons qu'il faut done enregistrer une serie de routines pour chaque verrou susceptible 
d'etre employe dans le processus fils, ce qui complique - parfois excessivement - l'ecriture 
des programmes. 

En fait, l'appel pthread_atfork( ) est principalement employe dans des programmes experi- 
mentaux, pour etudier justement les blocages dus aux partages de verrous. Dans des applica- 
tions courantes, on evite generalement de se trouver dans cette situation. Pour cela, on essaye 
de ne pas utiliser forkO, ou de le faire suivre immediatement d'un execO. On peut aussi 
appeler forkO avant la creation des threads et installer un mecanisme de communication 
entre processus, comme nous en verrons au chapitre 28. 

Zones d'exclusions mutuelles 

L'un des enjeux essentiels lors du developpement d' applications multithreads est la synchro- 
nisation entre les differents fils d'execution concurrents. Ce qui represente, somme toute, un 
aspect annexe des logiciels reposant sur plusieurs processus devient ici un point crucial. Les 
differents threads d'une application disposant d'un acces partage immediat a toutes les varia- 
bles globales, descripteurs de fichiers, etc., leur synchronisation est indispensable pour eviter 
la corruption de donnees et les situations de blocage. 

II existe essentiellement deux cas ou des donnees risquent d'etre corrompues si Faeces aux 
ressources communes n'est pas synchronise : 

• Deux threads concurrents veulent modifier une variable globale, par exemple decrementer 
un compteur dans une gestion de stocks. Le premier thread lit la valeur initiale V 0 dans un 
registre du processeur. II decremente la valeur d'une unite. L'ordonnanceur commute les 
taches et donne la main au second thread. Celui-ci lit la valeur initiale V 0 , la decremente et 
ecrit la nouvelle valeur V 0 - 1 dans le compteur. L'ordonnanceur reactive le premier thread 
qui inscrit a son tour la valeur calculee V 0 - 1 dans le compteur. Au final, le stock indique 
V 0 - 1 unites alors qu'il aurait du etre decremente deux fois. Ceci presage de serieux 
problemes le jour de l'inventaire. . . 
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• Un thread modifie une structure de donnees globale tandis qu'un autre essaye de la lire. 
Le thread lecteur charge les premiers membres de la structure. L'ordonnanceur bascule le 
controle au thread ecrivain, qui modifie toute la structure. Lorsque le second thread est 
reactive, il lit la fin de la structure. Les premiers membres qu'il a recus ne sont pas cohe- 
rents avec les suivants. Le probleme pourrait etre le meme avec une chaine de caracteres, 
ou meme une simple variable de type reel ou entier long. 

Pour acceder a des donnees globales, il est done indispensable de mettre en ceuvre un meca- 
nisme d'exclusion mutuelle des threads. Ce principe repose sur des donnees appelees mutex, 
de type pthread_mutex_t. Chaque variable sert de verrou pour Faeces a une zone particuliere 
de la memoire globale. 

II existe deux etats pour un mutex : disponible ou verrouille. Lorsqu'un mutex est verrouille 
par un thread, on dit que ce dernier tient le mutex. Un mutex ne peut etre tenu que par un seul 
thread a la fois. En consequence, il existe essentiellement deux fonctions de manipulation des 
mutex : une fonction de verrouillage et une fonction de liberation. Lorsqu'un thread demande 
a verrouiller un mutex deja maintenu par un autre thread, le premier est bloque jusqu'a ce que 
le mutex soit libere. 

On peut initialiser un mutex de maniere statique ou dynamique, en precisant certains attributs 
a l'aide d'un objet de type phtread_mutexattr_t. L initialisation statique se fait a l'aide de la 
constante PTHREAD_MUTEX_INITIALIZER : 

pthread_mutex_t mutex = PHTREAD_MUTEX_INITIALIZER; 

Pour F initialisation dynamique, on emploie pthread_mutex_init() avec une variable regrou- 
pant les attributs du mutex. 

int pthread_mutex_init (pthread_mutex_t * mutex, 

const pthread_mutexattr_t * attributs); 

On 1' emploie generalement ainsi : 

pthread_mutex_t mutex; 
pthread_mutexattr_t mutexattr. 

/* initialisation de mutexattr */ 
[...] 

/* initialisation du mutex */ 
if ((mutex = malloc(sizeof(pthread_mutex_t)) == NULL) 
return -1; 

pthread_mutex_init(& mutex, & mutexattr); 
[...] 

Etant donne que les mutex servent a synchroniser differents threads, on les declare naturelle- 
ment dans des variables globales ou dans des variables locales statiques. 

On peut utiliser un pointeur NULL en second argument de pthread_mutex_i ni t( ) si le mutex 
doit avoir les attributs par defaut. Nous verrons plus bas comment configurer les attributs 
desires. Une fois qu'un mutex n'est plus utilise, on libere la variable en appelant pthread_ 
mutex_destroy( ). 
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Le mutex ne doit plus etre verrouille, sinon cette fonction echoue avec Ferreur EBUSY. 

int pthread_mutex_destroy (pthread_mutex_t * mutex); 

La fonction de verrouillage s'appelle pthread_mutex_l ock( ). Si le mutex est libre, il est 
immediatement verrouille et attribue au thread appelant. Si le mutex est deja maintenu par un 
autre thread, la fonction reste bloquee jusqu'a la liberation du mutex, puis elle le verrouille a 
la disposition du thread appelant. Cette fonction peut done rester bloquee indefiniment. Ce 
n'est pourtant pas un point d'annulation car la norme SUSv3 reclame que l'etat des mutex 
soit parfaitement previsible lors de l'annulation d'un thread. Si pthread_mutex_l ock( ) 
pouvait etre un point d'annulation, l'etat du thread serait imprevisible. 

Si pthreadjnutexjl ock( ) est invoquee sur un mutex deja maintenu par le thread appelant, le 
resultat depend du type de mutex - determine par les attributs employes lors de F initialisation : 

• Un mutex normal bloque le thread appelant jusqu'a sa liberation. Comme celle-ci est 
impossible, le thread reste bloque definitivement. 

• Si le mutex est de type recursif- extension non portable - le thread le verrouille a nouveau 
en incrementant un compteur interne. II faudra alors debloquer le mutex un nombre egal de 
fois pour qu'il devienne vraiment disponible. 

• Si nous avons a faire a un mutex de diagnostic - egalement non portable -, la fonction 
pthread_mutex_l ock( ) echoue en renvoyant le code EDEADLOCK qui indique une situation de 
blocage definitif. Cela permet de rechercher les cas d'erreur lors d'une session de debo- 
gage. 

Le prototype de pthread_mutex_l ock( ) est le suivant : 

int pthread_mutex_l ock (pthread_mutex_t * mutex); 

La liberation d'un mutex se fait avec la fonction pthread_mutex_unlock(). Si le mutex est 
recursif, il ne sera effectivement debloque que si le compteur interne de verrouillage tombe a 
zero. Avec un mutex de diagnostic, une erreur (EPERM) se produit si le thread appelant ne 
possede pas le mutex. Avec les autres mutex, cette verification n'a pas lieu, mais ce compor- 
tement n'est pas standard. 

int pthread_mutex_unl ock (pthread_mutex_t * mutex); 

Enfin, il existe une fonction nominee pthread_mutex_tryl ock( ) fonctionnant comme pthread_ 
mutex_l ock( ), a la difference qu'elle echoue avec l'erreur EBUSY, plutot que de rester bloquee, 
si le mutex est deja verrouille. 

j int pthread_mutex_tryl ock (pthread_mutex_t * mutex); 

II est generalement deconseille d'employer pthread_mutex_tryl ock( ). Notamment, si on 
desire surveiller plusieurs mutex a la fois, on n'utilisera pas une construction du genre : 

while (1) { 

if (pthread_mutex_tryl ock(& mutex_l) == 0) 
break; 

if (pthread_mutex_tryl ock(& mutex_2) == 0) 
break; 

if (pthread_mutex_tryl ock(& mutex_3) == 0) 
break; 

} 
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Ce code est tres mauvais car il gache inutilement des ressources CPU, alors qu'il est possible 
de le remplacer par une attente de conditions, comme nous le verrons dans la prochaine 
section. 

Les attributs d'un mutex, enregistres dans un objet de type mutex_attr_t, peuvent etre initia- 
lises avec la fonction pthread_mutexattr_init( ) et detruits avec pthread_mutexattr_ 
destroy( ). 

int pthread_mutexattr_init (pthread_mutexattr_t * attributs); 
int pthread_mutexattr_destroy (pthread_mutexattr_t * attributs); 

Les variables pthread_mutexattr_t, avec la bibliotheque NPTL, ne comportent qu'un seul 
attribut, le type de mutex. Pour le configurer, on emploie la fonction pthread_mutexattr_ 
settype( ) et pthread_mutexattr_gettype( ) pour le lire. 

int pthread_mutexattr_settype (pthread_mutexattr_t * attributs, 

int type) ; 

int pthread_mutexattr_gettype (pthread_mutexattr_t * attributs, 

int * type) ; 

Le type d'un mutex est represente par l'une des constantes suivantes : 





Norn 


Signification 


PTHREAD. 


_MUTEX_NORMAL 


Mutex normal, rapide. Linvocation double de pthread_mutex_lock() dans le 
meme thread conduit a un blocage definitif. 


PTHREAD. 


_MUTEX_RECURSIVE 


Mutex recursif. Un meme thread peut le verrouiller a plusieurs reprises, il faudra 
le liberer autant de fois. 


PTHREAD. 


_MUTEX_ERRORCHECK 


Mutex de diagnostic. Une tentative de double verrouillage echoue. 





Attention 

Ces constantes ayant ete normalisees par SUSv3 alors qu'elles etaient absentes de la norme Posix.lc 
precedente, il faut initialiser la constante symbolique _X0PEN_S0URCE avec la valeur 500 avant d'inclure 
<pthread . h>. 



Le programme suivant utilise un mutex comme verrou pour restreindre Faeces au flux stdout. 
Nous lan5ons en parallele une dizaine de threads, qui vont attendre une duree aleatoire avant 
de demander un blocage du mutex. L attente aleatoire sert a perturber un peu le determinisme 
de l'ordonnanceur et a eviter de voir les threads se derouler dans l'ordre croissant. 

exemple_mutex.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <pthread.h> 

static void * routine_threads (void * argument); 
static int aleatoire (int maximum); 



312 



Programmation systeme en C sous Linux 



pthread_mutex_t mutex_stdout = PTHREAD_MUTEX_I NITIALIZER; 

int 
main (void) 
{ 

int i; 
pthread_t thread; 

for (i = 0; i < 10; i ++) 

pthread_create(& thread, NULL, routine_threads , (void *) i); 
pthread_exit(NULL) ; 

} 

static void * 
routine_threads (void * argument) 
{ 

int numero = (int) argument; 
int nombre_iterations; 
int i ; 

nombre_iterations = 1+al eatoi re(3) ; 

for (i =0; i < nombre_iterations; i ++) { 

si eep(aleatoi re(3) ) ; 

pthread_mutex_lock(& mutex_stdout) ; 

fprintf (stdout, "Le thread %d a obtenu le mutex \n", numero); 
si eep(aleatoi re(3) ) ; 

fprintf (stdout, "Le thread %d relache le mutex \n", numero); 
pthread_mutex_unl ock(& mutex_stdout) ; 

} 

return NULL; 



static int 
al eatoi re (int maximum) 
{ 

double d; 

d = (double) maximum * randO; 
d = d / (RAND_MAX + 1.0); 
return (tint) d); 

} 

On remarque l'emploi de pthread_exi t( ) en fin de fonction mainO pour terminer le fil 
d'execution principal, sans finir les autres threads. Ceci est parfaitement defini dans la norme 
SUSv3. 



Attention 

Les premieres implementations de la NPTL contiennent un bogue qui termine toute ('application si le thread 
main invoque pthread_exit( ) avant que les autres threads n'aient reellement demarre. Une solution 
simple pour eviter ce probleme (corrige dans les implementations ulterieures) est d'ajouter un petit sommeil 
d'une seconde avant le pthread_exit( ). 
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Le deroulement du processus montre bien que Faeces est correct, malgre les demandes 
concurrentes de verrouillage du mutex. 
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Le thread 1 a obtenu le mutex 
Le thread 1 relache le mutex 
Le thread 1 a obtenu le mutex 
Le thread 1 relache le mutex 
$ 

La definition des venous corrects a employer pour acceder aux donnees partagees est une tache 
importante de la conception des programmes multithreads. En prenant l'exemple d'une 
grosse base de donnees - des reservations fenoviaires par exemple -, il serait vraiment peu 
efficace de verrouiller l'ensemble de la base a chaque fois qu'un thread veut ajouter un enre- 
gistrement. D'un autre cote, un trop grand nombre de mutex independants peut aussi devenir 
problematique. Qu'un thread ait systematiquement besoin de verrouiller simultanement 
plusieurs mutex peut etre tres dangereux, car la moindre maladresse dans le programme 
risque de declencher des blocages inemediables. Dans cette situation d'etreinte fatale, un 
thread maintient un mutex et en attend un autre, alors qu'un autre thread est coince dans la 
situation inverse. 

II est done indispensable de bien dimensionner le probleme et de decider de la granularite des 
portions protegees par un mutex. 

Attente de conditions 

Lorsqu'un processus doit attendre le deblocage du premier mutex disponible dans un 
ensemble, ou s'il doit patienter jusqu'a ce qu'un evenement survienne dans un autre thread, 
on emploie une autre technique de synchronisation. II existe des variables « conditions » 
representees par le type pthread_cond_t. Un thread peut se mettre en attente d'une condition, 
et lorsqu'elle est realisee par un autre thread, ce dernier Ten avertit directement. 

Le principe est simple, reposant sur deux fonctions de manipulation des conditions : l'une est 
1' attente de la condition, le thread appelant restant bloque jusqu'a ce qu'elle soit realisee, et 
1' autre sert a signaler que la condition est remplie. C'est l'application qui affecte une signifi- 
cation a la variable condition, qui est simplement consideree comme une variable booleenne 
un peu speciale par la bibliotheque Pthreads. 

Les variables conditions ont des attributs, de type pthread_condattr_t, qui n'ont pas d'utilite 
dans la bibliotheque NPTL. En consequence, on initialisera generalement les conditions de 
maniere statique 

pthread_cond_t condition = PTHREAD_COND_I INITIALIZER; 

ou en employant la fonction pthread_cond_init( ), en passant un second argument NULL 

j int pthread_cond_init (pthread_cond_t * condition, 

pthread_condattr_t * attributs); 

Une condition inutilisee est liberee avec pthread_cond_destroy( ). Aucun autre thread ne doit 
etre en attente sur la condition, sinon la liberation echoue avec l'erreur EBUSY. 

int pthread_cond_destroy (pthread_cond_t * condition); 

Voyons a present 1' utilisation effective d'une condition. Tout d'abord, il faut signaler qu'une 
condition est toujours associee a un mutex, ceci pour eviter des problemes de concurrence 
d'acces sur la variable. 
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Examinons d'abord le thread qui doit attendre une condition : 

1. On initialise la variable condition et le mutex qui lui est associe. 

2. Le thread bloque le mutex. Ensuite, il invoque la routine pthread_cond_wait( ) qui attend 
que la condition soit realisee. 

3. Le thread libere le mutex. 

Maintenant, voyons le thread qui realise la condition : 

1. Le thread travaille jusqu'a avoir realise la condition attendue. 

2. II bloque le mutex associe a la condition. 

3. Le thread appelle la fonction pthread_cond_signal ( ) pour montrer que la condition est 
remplie. 

4. Le thread debloque le mutex. 

Ce schema est a priori surprenant puisqu'il semble que, lorsque le second thread desire 
signaler la realisation de la condition, Faeces lui soit interdit, le premier thread ay ant bloque 
le mutex. En fait, la fonction pthread_cond_wait( ) fonctionne en trois temps : 

1. D'abord, elle debloque le mutex associe a la condition, et elle se met en attente. Cette 
operation est realisee de maniere atomique vis-a-vis de la bibliotheque Pthreads. 

2. L'attente se poursuit jusqu'a ce que la realisation de la condition soit indiquee. 

3. La condition etant remplie, la fonction termine son attente et bloque a nouveau le mutex, 
avant de revenir dans le programme appelant. 

Le scenario se deroule done ainsi : 



Thread attendant la condition 


Thread signalant la condition 


Appel de pthread_mutex_lock() : blocage du mutex 




associe a la condition. 




Appel de pthread_cond_wai t( ) : deblocage du mutex. 


... attente ... 


Appel de pthread_mutex_lock( ) sur le mutex. 




Appel de pthread_cond_signal (), qui reveille I'autre 




thread. 


Dans pthread_cond_wait( ), tentative de recuperer le 




mutex. Blocage. 






Appel de pthread_mutex_unlock( ). Le mutex etant 




libere, I'autre thread se debloque. 


Fin de pthread_cond_wait( ). 


Appel de pthread_mutex_unlock( ) pour revenir a I'etat 




initial. 





On peut verifier qu'il n'y a pas de risque d'interblocage des deux threads ni de risque de 
perdre la signalisation d'une condition des que le premier pthread_mutex_l ock( ) a ete 
invoque. 
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Les prototypes de ces deux fonctions sont les suivants : 

int pthread_cond_signal (pthread_cond_t * condition); 
int pthread_cond_wait (pthread_cond_t * condition, 
pthread_mutex_t * mutex); 

Le terme « signal » present dans pthread_cond_si gnal ( ) ne doit pas etre confondu avec les 
signaux que nous avons etudies dans les chapitres 6 a 8. Nous reviendrons sur les interactions 
entre threads et signaux a la fin du chapitre. 

Dans l'exemple suivant, un thread sert a gerer des alarmes, alors qu'un autre surveille (simule) 
des variations de temperature. 

exemple_condition.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <pthread.h> 

pthread_cond_t condition_alarme 

= PTHREAD_COND_I NITI ALIZER; 
pthread_mutex_t mutex_al arme 

= PTHREAD_MUTEX_I NITI ALIZER; 

static void * thread_temperature (void * inutile); 
static void * thread_al arme (void * inutile); 

static int aleatoire (int maximum); 

int 
main (void) 
{ 

pthread_t thr; 

pthread_create(& thr, NULL, thread_temperature, NULL); 
pthread_create(& thr, NULL, thread_alarme, NULL); 
pthread_exit(NULL) ; 

} 

static void * 
thread_temperature (void * inutile) 
{ 

int temperature = 20; 
while (1) { 

temperature += aleatoire(5) - 2; 
fprintf (stdout, "Temperature : %d \n", temperature); 
if ((temperature < 16) || (temperature > 24)) ( 
pthread_mutex_lock(& mutex_al arme) ; 
pthread_cond_signal (& condi tion_al arme) ; 
pthread_mutex_unl ock(& mutex_al arme) ; 

} 

sleep(l); 

} 

return NULL; 

} 
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static void * 
thread_al arme (void * inutile) 
{ 

while (1) { 

pthread_mutex_lock(& mutex_alarme) ; 
pthread_cond_wait(& condition_alarme, 

& mutex_al arme) ; 
pthread_mutex_unl ock(& mutex_al arme) ; 
fprintf (stdout, "ALARME\n" ) ; 

} 

return NULL; 

} 

L' execution montre bien Factivation du thread d'alarme lorsque la condition est signalee. 
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En fait, ce programme peut poser un probleme. La norme SUSv3 autorise l'appel pthread_ 
cond_wait( ) a se terminer de maniere impromptue, meme si la condition n'est pas realisee. 
Ceci, je suppose, permet de simplifier 1' implementation d'une bibliotheque Pthreads vis-a-vis 
des appels-systeme lents interrompus par un signal. 

II faut done accompagner Finvocation de pthread_cond_wait( ) d'une verification de l'etat de 
la condition. Dans notre cas, cela necessiterait d'une part de transferer la variable tempe- 
rature en zone globale partagee et d'utiliser un mutex - eventuellement le meme - pour 
acceder a son contenu. On aurait done quelque chose comme : 

pthread_mutex_l ock (& mutex_al arme) ; 

while ((temperature > 15) && (temperature < 25)) 

pthread_cond_wait (& condition_alarme, & mutex_al arme) ; 

pthread_mutex_unlock (& mutex_al arme) ; 
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D'autre part, la modification de la variable temperature dans le second thread devrait etre 
encadree par un couple blocage / deblocage de mutex_al arme. 

II existe une fonction d'attente temporisee, nommee pthread_cond_timedwait( ), permettant 
de limiter le delai imparti pour la realisation de la condition. 

int pthread_cond_timedwait (pthread_cond_t * condition. 

pthread_mutex_t * mutex, 
const struct timespec * date); 

Attention, on ne precise pas la duree d'attente mais l'heure maximale jusqu'a laquelle la 
fonction peut attendre. La structure timespec a ete decrite dans le chapitre 8, elle contient un 
champ contenant le nombre de secondes ecoulees depuis le l er janvier 1970, et un champ 
indiquant le complement en nanosecondes. Pour obtenir la date actuelle, on peut employer les 
appels-systeme time( ) ou gettimeofday ( ) , que nous etudierons dans le chapitre 25. 

Si le delai est depasse, cette fonction echoue avec l'erreur ETIMEDOUT. Meme dans ce cas, il est 
important de s'assurer si la condition n'est pas verifiee quand meme, notamment si plusieurs 
threads attendent la realisation de la meme condition. 

Dans ce cas en effet, la fonction pthread_cond_signal ( ) garantit qu'un seul thread en attente 
sera reveille. Lorsqu'on desire reveiller tous les threads qui surveillent cette condition, il faut 
employer pthread_cond_broadcast( ). Dans un cas comme dans Fautre, aucune erreur ne se 
produit si aucun thread n'est en attente. 

int pthread_cond_broadcast (pthread_cond_t * condition); 

Les personnes decouvrant la programmation multithread sont souvent surprises par le 
comportement de pthread_cond_wait( ) comme point d'annulation. En effet, lorsqu'un thread 
recoit une demande d'annulation durant cette fonction d'attente, elle se termine, mais doit 
recuperer d'abord le mutex associe a la condition. Cela signifie qu'elle peut bloquer indefini- 
ment avant de se terminer. 

Cette attitude peut surprendre si on considere l'annulation comme une demande de termi- 
naison urgente, a la maniere d'un signal SIGQUIT. Mais ce n'est pas la bonne facon de voir 
cette fonctionnalite. II est preferable d'imaginer la demande d'annulation a la maniere des 
applications graphiques dans lesquelles le clic sur un bouton Fermeture ne termine pas neces- 
sairement F application mais peut passer par une phase de sauvegarde eventuelle des donnees 
modifiees si l'utilisateur le desire. 

L'annulation d'un thread doit laisser les donnees manipulees dans un etat previsible, et le seul 
etat previsible du mutex associe a un appel pthread_cond_wait( ) est le verrouillage. Bien 
entendu, le thread ne doit pas se terminer en laissant le mutex bloque. II faut done utiliser une 
fonction de nettoyage : 

pthread_mutex_l ock(& mutex); 

pthread_cl eanup_push(pthread_mutex_unl ock, (void *) & mutex); 
while (! condition_realisee) 

pthread_cond_wait(& condition, & mutex); 

pthread_cleanup_pop(l) ; /* pthread_mutex_unlock (& mutex) */ 

Pour terminer cette section sur les variables conditions, mentionnons qu'il existe deux fonc- 
tions pthread_condattr_init( ) et pthread_condattr_destroy( ) permettant de manipuler les 
attributs des conditions de maniere dynamique. Ceci n'a pas grand interet sous Linux car 
1' implementation de la bibliotheque NPTL ne gere aucun attribut pour les variables conditions : 
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int pthread_condattr_init (pthread_condattr_t * attributs); 
int pthead_condattr_destroy (pthread_condattr_t * attributs); 



Semaphores 

La bibliotheque NPTL implemente un mecanisme de synchronisation qui a ete introduit par 
la norme Posix.lb (temps-reel) : les semaphores. Ces fonctionnalites sont declarees dans 
<semaphore.h>, elles sont disponibles si la constante symbolique _POSIX_SEMAPHORES est 
definie dans <unistd.h>. 



Attention 

II ne faut pas confondre les semaphores temps-reel, dont les fonctions sont prefixees par la chaine « sem_ », 
et les semaphores SystemeV, dont les noms commencent par « sem » et que nous etudierons dans le 
chapitre 29. 



Un semaphore est une variable de type sem_t servant a limiter 1'acces a une portion critique 
de code. II en existe deux types : le semaphore anonyme ne peut etre utilise que dans le 
processus qui l'a cree (il est toutefois accessible par tous les threads du processus). Au 
contraire, le semaphore nomme est accessible depuis plusieurs processus independants. 

L'acces aux semaphores nommes est une nouveaute de la bibliotheque NPTL. Jusque-la, 
seuls les semaphores anonymes etaient utilisables sous Linux. On a toutefois une contrainte 
avec les premieres versions de la bibliotheque NPTL : pour que les semaphores nommes 
soient utilisables, il faut que le pseudo-systeme de fichiers Tmpf s soit monte sur /dev/shm/. On 
se reportera aux documentations sur le noyau Linux pour plus de details. 

Un semaphore anonyme sera simplement declare ainsi : 
sem_t semaphore; 

puis initialise avec la fonction senMnitO ; on le libere symetriquement en employant sem_ 
destroy( ). Comme nous Favons deja observe avec les conditions, il ne faut pas qu'un thread 
attende un semaphore qu'on veut liberer, sinon cette fonction echoue avec Ferreur EBUSY dans 
errno. 

int sem_init (sem_t * semaphore, int partage, unsigned int valeur); 
int sem_destroy (sem_t * semaphore); 

Le second argument de sem_init( ) indique si le semaphore est reserve au processus appelant 
ou s'il doit etre partage entre plusieurs processus. 

Le troisieme argument represente la valeur initiale du semaphore. Cette valeur est inscrite 
dans un compteur qui est decremente chaque fois qu'un thread penetre dans la portion 
critique du programme, et incremente a chaque sortie de cette zone critique. 

L entree dans la portion critique ne peut se faire que si le compteur est strictement positif. 
Ainsi, la valeur initiale du compteur represente le nombre maximal de threads simultanement 
toleres dans la zone critique. La plupart du temps, nous initialiserons nos semaphores ainsi : 

I sem_t semaphore; 
[...] 

sem_init (& semaphore, 0, 1); 
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Pour acceder a un semaphore nomme, on utilise la fonction : 

sem_t * sem_open (const char * nom, int options. 

... /* mode_t mode, unsigned int valeur */ ); 

Le principe est assez semblable a celui des fichiers. Si le nom commence par un slash, il est 
unique pour tous les processus y faisant reference. Les options possibles sont constitutes par 
un OU binaire entre : 



Option Signification 

0_CREAT Creation d'un nouveau semaphore. Dans ce cas seulement les deux arguments suivants (mode et 
valeur) sont utilises. Sinon ils peuvent etre omis. Le troisieme argument de sem_open( ) indique les 
permissions d'acces au semaphore comme nous I'etudierons dans le chapitre 19 avec I'appel systeme 
open( ). Le dernier argument est la valeur du compteur du semaphore, comme le troisieme argument 
des em_i ni t ( ) . 

0_EXCL Utilise conjointement a I'option precedents, celle-ci garantit que I'appel systeme sem_open( ) echoue si 
le semaphore existe deja. 



Lorsque Ton a termine d'utiliser un semaphore nomme, on peut le liberer avec : 

int sem_cl ose(sem_t * semaphore); 

Lorsqu'un thread desire entrer dans la portion de code critique, il appelle la fonction sem_ 
wai t( ), qui attend que le compteur du semaphore soit superieur a zero, et le decremente avant 
de revenir. La verification de la valeur du compteur et sa decrementation sont liees de maniere 
atomique, evitant ainsi tout probleme de concurrence d'acces. Cette fonction est un point 
d'annulation pour les Pthreads. 

int sem_wait (sem_t * semaphore); 

Une fois que le processus a fini de travailler dans la portion critique, il invoque en sortant la 
fonction sem_post( ), qui incremente le compteur. 

int sem_post (sem_t * semaphore); 

Cette fonction peut echouer si la valeur du compteur depasse SEM_VALUE_MAX. Ceci est reve- 
lateur d'un bogue ou on invoque a repetition sem_post( ) sans avoir appele sem_wait( ) aupa- 
ravant. 

II existe une fonction sem_trywait( ) fonctionnant comme sem_wait( ) mais qui ne bloque pas. 
Elle renvoie -1 et positionne EAGAI N dans errno si le compteur n'est pas superieur a zero. 

int sem_trywait (sem_t * semaphore); 

On peut aussi consulter directement la valeur du compteur d'un semaphore en appelant sem_ 
getvalueO qui stocke l'etat actuel dans la variable sur laquelle on transmet un pointeur en 
second argument. 

int sem_getvalue (sem_t * semaphore, int * valeur); 

L'exemple suivant illustre une utilisation simple des semaphores, pour limiter a trois le nombre 
de threads simultanement presents dans une portion critique. 
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exemple_semaphores.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <pthread.h> 
#include <semaphore.h> 
#include <unistd.h> 

sem_t semaphore; 

static void * routine_thread (void * numero_thread) ; 
static int aleatoire (int maximum); 

int 
main (void) 

{ 

int i; 
pthread_t thread; 

sem_init(& semaphore, 0, 3); 
for (i = 0; i < 10; i ++) 

pthread_create(& thread, NULL, routine_thread, (void *) i); 
pthread_exit(NULL) ; 



void * 

routine_thread (void * numero_thread) 

{ 

int i; 

for (i = 0; i < 2; i ++) { 
sem_wait(& semaphore); 

fprintf (stdout, "Thread %d dans portion critique \n", 

(int) numero_thread) ; 
si eeptal eatoi re(4) ) ; 

fprintf (stdout, "Thread %d sort de la portion critique \n", 

(int) numero_thread) ; 
sem_post(& semaphore); 
si eeptal eatoi re(4) ) ; 

} 

return NULL; 

} 

L' execution permet de verifier la limitation du nombre de threads accedant simultanement a 
la portion critique. 

$ ./exemple_semaphores 

Thread 0 dans portion critique 

Thread 1 dans portion critique 

Thread 2 dans portion critique 

Thread 1 sort de la portion critique 

Thread 3 dans portion critique 

Thread 0 sort de la portion critique 
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$ 

Voici un exemple simple de semaphores nommes, partages entre deux processus. II s'agit 
d'un processus pere et de son fils, mais on pourrait tres bien les implementer sous forme de 
deux applications independantes. 

exemple_semaphores_nommes.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <pthread.h> 
#include <semaphore. h> 
#include <unistd.h> 
#incl ude <fcntl .h> 

static int processus (const char * nom); 
static int aleatoire (int maximum); 
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i nt 

main (void) 
{ 

switch (forkO) { 
case -1: 

perror( "fork" ) ; 
exit(EXIT_FAILURE); 

case 0: 

return processust "Fi 1 s" ) ; 

default: 

return processust "Pere" ) ; 

} 

} 



static int 
processus (const char * nom) 
{ 

sem_t * semaphore; 
int i; 



semaphore = sem_open( "/mon_semaphore" , 0_CREAT, 0600, 1); 
if (semaphore == SEM_FAI LED ) { 

perror(nom) ; 

exit(EXIT_FAILURE); 

} 



for (i = 0; i < 2; i ++) { 
sem_wait(semaphore) ; 

fprintf (stdout, "Us dans portion critique\n", nom); 
si eeptaleatoi re(4) ) ; 

fprintf (stdout, "%s sort de la portion critique\n", nom); 
sem_post(semaphore) ; 
si eeptaleatoi re(4) ) ; 

} 

sem_cl oset semaphore) ; 
return EXIT_SUCCESS; 

} 

L' execution nous montre que les deux processus sont bien synchronises en ce qui concerne 
Faeces a la portion critique : 

$ ./exemple_semaphores_nommes 

Fi 1 s dans portion critique 

Fils sort de la portion critique 

Pere dans portion critique 

Pere sort de la portion critique 

Fils dans portion critique 

Fils sort de la portion critique 

Pere dans portion critique 

Pere sort de la portion critique 

$ 



324 



Programmation systeme en C sous Linux 



On notera que la bibliotheque NPTL implemente egalement d'autres mecanismes de synchro- 
nisation, que nous ne detaillerons pas ici, mais qui sont interessants a connaitre : 

• Les barrieres pthread_barri er_t : un appel pthreadj>arrier_wait( ) est bloquant tant 
qu'un certain nombre de threads ne l'a pas invoque. Une fois que ce nombre (program- 
mable a F initialisation de la barriere) est atteint, la barriere est levee et les threads sont 
debloques. 

• Les verrous pthread_rwl ock_t : ils fonctionnent comme les mutex mais avec une indica- 
tion qualitative de l'usage que le thread compte faire du verrou. Deux threads qui deman- 
dent le meme verrou pour un acces en lecture sur les donnees qu'il protege seront toleres 
simultanement, alors qu'un thread qui demande un verrou pour un acces en ecriture devra 
etre le seul a en disposer. 

Donnees privees d'un thread 

Les threads doivent souvent manipuler des donnees privees. Dans la plupart des cas, on peut 
simplement utiliser des variables locales qui sont stockees dans la pile privee du thread au 
moment de 1' entree dans la fonction. II y a pourtant des cas ou un thread a besoin d' utiliser 
des variables privees disponibles de maniere globale. On peut par exemple imaginer un 
module implementant une bibliotheque de fonctions qui stocke certaines informations dans 
des variables statiques entre deux invocations de fonction. 

Pour permettre ce comportement, la norme SUSv3 introduit la notion de cles associees a des 
donnees privees. La cle est une variable de type pthread_key_t, qui peut resider en variable 
statique. La bibliotheque associe la cle avec un pointeur void * different pour chaque thread. 

L initialisation d'une cle privee se fait a l'aide de la fonction pthread_key_create( ) , a 
laquelle on peut eventuellement passer un pointeur sur une fonction de destruction qui libere 
le pointeur associe si le thread se termine avant que la cle ne soit detruite avec pthread_key_ 
delete( ). 

int pthread_key_create (pthread_key_t * cle_privee, 
void (* fonction) (void *)); 
int pthread_key_del ete (pthread_key_t cle_privee); 

Une fois qu'une cle a ete initialisee, on utilise la fonction pthread_setspeci f i c( ) pour Fasso- 
cier a un pointeur representant des donnees personnelles du thread. 

int pthread_setspecific (pthread_key_t cle_privee, const void * data); 

Pour lire les donnees associees a une cle, on emploie pthread_getspecific(). 

void * pthread_getspecific (pthread_key_t cle_privee); 

En imaginant un module permettant de charger un fichier de donnees, puis d'acceder ensuite 
a son contenu a travers des fonctions d'interrogation, on peut construire le schema suivant : 

pthread_key_t cle_privee; 
int 

ouverture_fichier (const char * nom_fichier) ; 
{ 

FILE * fp; 
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struct donnees * donnees; 
int nb_donnees; 
int i ; 

pthread_key_create(& cle_privee, free); 
fp = fopen(nom_fichier, "r"); 
/* lecture nb_donnees */ 
[...] 

donnees = (struct donnees *) cal 1 oc(nb_donnees , 

sizeof (struct donnees)); 

/* lecture des donnees */ 
for (i =0; i < nb_donnees; i++) 
[...] 

pthread_setspecific(& cle_privee, donnees); 
return nb_donnees; 

} 

int 

resultat_donnee (int num) 
{ 

struct donnees * donnees; 

donnees = (struct donnees *) pthread_getspecific(& cle_privee); 
return donnees[num] . resul tats ; 

} 

En fait, la robustesse du programme serait sensiblement renforcee en employant la fonction 
pthread_once( ) afin de garantir que 1' initialisation de la cle n'ait lieu qu'une seule fois. 

Le fonctionnement des donnees privees est assez subtil lors de la liberation des cles avec 
pthread_key_del ete( ). Pour plus de precisions, on consultera la documentation de la biblio- 
theque LinuxThreads. 

Une question peut se poser en ce qui concerne la variable globale errno, mise a jour par 
l'essentiel des appels-systeme et fonctions de bibliotheque C. En effet, on peut presumer un 
gros risque d' interferences si la variable globale est simultanement modifiee par des appels- 
systeme survenant dans des threads concurrents. Une solution consisterait a abandonner 
F usage de cette variable et a toujours renvoyer la valeur d'erreur plutot que d' employer -1 
(comme le font d'ailleurs les routines de la bibliotheque NPTL). Neanmoins, cette methode 
n'est pas applicable car elle necessiterait de profonds bouleversements tant dans le noyau que 
dans la bibliotheque C. II a done ete decide dans la norme SUSv3 de tolerer 1' existence d'une 
variable errno privee pour chaque thread. 

On peut ainsi considerer qu'un thread dispose comme donnees privees de variables allouees 
dans sa pile, de donnees associees aux cles privees, et de la variable globale errno. 



Les threads et les signaux 

II est generalement deconseille d'utiliser une gestion des signaux dans les applications multi- 
threads, mais cela est parfois indispensable. Les principes essentiels sont les suivants : 

• La gestion d'un signal (en l'ignorant, en laissant le comportement par defaut, ou en instal- 
lant un gestionnaire) est assuree globalement pour Fensemble de l'application en employant 
la routine sigaction( ). Cet appel-systeme a ete decrit dans le chapitre 7. 



326 



Programmation systeme en C sous Linux 



• Le blocage temporaire d'un signal est realise au niveau du thread en utilisant la routine 
pthread_sigmask() qui fonctionne de maniere similaire a sigprocmask( ) mais en limitant 
son effet au thread appelant. 

int pthread_sigmask (int methode, 

const sigset_t * masque, 
sigset_t * ancienjnasque) ; 

• Pour envoyer un signal a un thread, on utilise pthread_kill (). Cette routine fonctionne 
comme l'appel-systeme ki 1 1 ( ). Bien entendu, il faut que remission du signal se fasse de 
maniere interne, au sein du meme programme, puisqu'il faut avoir acces a la variable 
pthread_t indiquant le thread vise. On peut envoyer des signaux classiques ou des signaux 
temps-reel, mais dans ce cas, il faut noter que pthread_ki 1 1 ( ) ne permet pas d'associer une 
structure siginfo au signal, contrairement asigqueueO. 

int pthread_kill (pthread_t thread, int numero_signal ) ; 

• Un signal interne - emis par pthread_ki 1 1 ( ) - ou un signal externe synchrone - comme 
SIGBUS, SIGFPE, SIGPIPE qui viennent en reponse a une action particuliere d'un thread - 
sont naturellement recus par le thread vise. 

• Un signal externe asynchrone doit, selon la norme SUSv3, etre recu par l'ensemble du 
processus, puis le noyau doit choisir arbitrairement un thread ne bloquant pas le signal 
pour le lui envoyer. Avant Linux 2.6, 1' implementation LinuxThreads differait legerement 
de ce schema puisque les threads etaient represented par des processus independants. II n'y 
avait done pas de choix possible, le signal etant dirige vers le thread initialement vise, 
meme si ce dernier bloquait sa reception. Depuis le noyau 2.6, la bibliotheque NPTL 
permet de gerer cette situation. 

Dans notre exemple, nous allons installer un gestionnaire commun pour tout un ensemble de 
signaux temps-reel. Ensuite chaque thread va bloquer tous ces signaux sauf un (specifique a 
chaque thread). Nous enverrons depuis une autre console des signaux au processus, et verrons 
s'ils arrivent bien sur les threads corrects. 

exemple_signaux : 

#include <stdio.h> 
//include <stdlib.h> 
//include <signal .h> 
//Include <pthread.h> 
//include <unistd.h> 

//define NB_THREADS 5 

static void * fonction_thread (void * void_arg); 
static void gestionnaire (int numero); 

int 
main (void) 
{ 

int i ; 

static pthread_t thr; 
struct sigaction action; 
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fprintf (stdout, "Thread main, mon PID est %ld\n", (long) getpidO); 

si gf i 1 1 set (& action. sajnask) ; 
action. sa_handler = gestionnaire; 
action.sa_flags = 0; 

for (i = SIGRTMIN ; i < SIGRTMIN+NB_THREADS; i ++) { 
if (sigactionti , & action, NULL) == 0) 

fprintf (stdout, "Signal %d captureAn", i); 

el se 

fprintf (stdout, "Signal %d NON captureAn", i); 

} 

for (i = 0; i < 5; i ++) 

pthread_create(& thr, NULL, fonction_thread, (void *) i); 

fprintf (stdout, "Thread main, je me termineW); 
pthread_exit(NULL); 

} 



static void * 
fonction_thread (void * void_arg) 
{ 

sigset_t masque; 

int numero = (int) void_arg; 

int i; 

fprintf (stdout, "Thread %d, mon PID est %ld\n", numero, 

(long) getpidO); 

sigemptyset(& masque); 
for (i = 0; i < NB_THREADS; i ++) 
if (i != numero) 

sigaddset(& masque, SIGRTMIN + i); 
pthread_sigmask(SIG_BLOCK, & masque, NULL); 

fprintf (stdout, "Thread %d bloque tout sauf %d\n", numero, 
SIGRTMIN+numero) ; 

while (1) { 
pauset ) ; 

fprintf (stdout, "Thread %d a regu un signal\n", numero); 

} 

return NULL; 

} 

void 

gestionnai re(int numero) 

{ 

fprintf (stdout, ">>> signal %d regu <<<\n", numero); 

} 
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L' execution se deroule sur deux consoles differentes. Nous voyons bien qu'avec la biblio- 
theque NPTL les threads ont tous le meme PID (contrairement a la bibliotheque Linux- 
Threads). 

$ ./exemple_signaux 

Thread main, mon PID est 6641 

Signal 33 capture 

Signal 34 capture 

Signal 35 capture 

Signal 36 capture 

Signal 37 capture 

Thread 0, mon PID est 6641 

Thread 0 bloque tout sauf 33 

Thread 1, mon PID est 6641 

Thread 1 bloque tout sauf 34 

Thread 2, mon PID est 6641 

Thread 2 bloque tout sauf 35 

Thread 3, mon PID est 6641 

Thread 3 bloque tout sauf 36 

Thread 4, mon PID est 6641 

Thread 4 bloque tout sauf 37 

Thread main, je me termine 

$ kill -33 6641 

>>> signal 33 recu <<< 

Thread 0 a recu un signal 

>>> signal 35 recu <<< 
Thread 2 a recu un signal 

>>> signal 37 recu <<< 
Thread 4 a recu un signal 

>>> signal 34 recu <<< 
Thread 1 a recu un signal 

>>> signal 36 recu <<< 
Thread 3 a recu un signal 

Processus arrete 
$ 

Si on deconseille en regie generate d'utiliser trop de signaux dans une application multi- 
thread, c'est principalement parce que les fonctions permettant de manipuler les threads ne 
doivent pas etre appelees depuis un gestionnaire de signaux. La norme SUSv3 indique que 
ces routines ne sont pas necessairement reentrantes face a une interruption asynchrone due a 
un signal, et que leur emploi dans un gestionnaire de signaux conduit a un comportement 
indefini. 

Pour resoudre ce probleme, il est plus simple d'eviter d'utiliser un gestionnaire de signaux et 
de creer un thread specifiquement charge de la reception de tous les signaux - ou du moins 
d'une partie d'entre eux. Ce thread fonctionnera en boucle sur la fonction sigwaitO. 

int sigwait(const sigset_t * masque, int * numero_signal ) ; 



$ kill -35 6641 



$ kill -37 6641 



$ kill -34 6641 



$ kill -36 6641 



$ kill -KILL 6641 
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Cette routine fonctionne de facon identique a sigwaitinfo( ), que nous avons rencontree dans 
le chapitre 8, en attendant l'un des signaux contenus dans le masque passe en premier argu- 
ment. Si un signal arrive, si gwai t( ) se termine apres avoir stocke le numero du signal dans le 
pointeur passe en second argument. La fonction sigwaitO etant un point d'annulation, on 
pourra laisser sans crainte un thread boucler dessus. 

L'utilisation de sigwait( ) permet d'eviter Femploi d'un gestionnaire. L' execution du thread 
se poursuivant de maniere normale, il est possible d'utiliser toutes les routines de la biblio- 
theque Pthreads dans une construction switch/case. Pour garantir un bon fonctionnement de 
sigwaitO, il est indispensable que tous les autres threads bloquent les signaux attendus, 
evitant ainsi toute ambiguite concernant le recepteur. 



Conclusion 

Dans ce chapitre nous avons essaye d'introduire les notions essentielles de la programmation 
multithread et de presenter les fonctions mises a disposition par la bibliotheque NPTL. 

Pour une etude plus poussee concernant la norme Posix.lc, les circonstances de blocages, ou 
la conception meme des programmes multithreads, on pourra consulter [NICHOLS 1996] 
Pthreads Programming ou [BUTENHOF 1997] Programming with POSIX Threads. 

Des informations interessantes peuvent egalement etre trouvees dans les nombreuses FAQ 
Internet concernant les threads. 
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Nous allons nous interesser dans ce chapitre a toutes les techniques permettant de gerer avec 
plus ou moins de precision l'espace memoire d'un processus. 

Nous commencerons par les principes d' allocation de memoire dynamique. Ces mecanismes 
sont relativement classiques, peu differents des autres systemes d' exploitation en ce qui 
concerne le programmeur applicatif. Par contre, la bibliotheque GlibC offre des possibilites 
puissantes pour le debogage, en assurant un suivi de toutes les allocations ou en permettant 
d'inserer notre propre code de surveillance dans le corps meme des routines de gestion de la 
memoire. 

Des fonctionnalites avancees de manipulation de la memoire seront examinees dans le chapitre 
suivant. 

Indiquons rapidement que la gestion de la memoire partagee, sujet connexe a celui de ce 
chapitre, sera etudiee ulterieurement avec les mecanismes de communication entre processus. 

Routines classiques d'allocation et de liberation de memoire 

Les variables utilisees dans un programme C peuvent etre allouees de diverses manieres : 

• Les variables globales ou les variables declarees statiques au sein des fonctions sont 
allouees une fois pour toutes lors du chargement du programme. II existe meme une diffe- 
rence entre les variables qui sont initialisees automatiquement au demarrage et celles qui 
n'ont pas de valeur initiale precise. 

• Les variables locales et les arguments des fonctions voient leurs emplacements reserves 
dans la pile lors de F invocation de la fonction. 

• Les variables dynamiques sont allouees explicitement par F intermediate des routines que 
nous allons etudier, a travers des pointeurs sur les zones reservees. 
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Le fait d' employer des variables dynamiques complique quelque peu la programmation, 
puisqu'il faut les manipuler au travers de pointeurs. De plus, elles doivent etre allouees 
manuellement avant toute utilisation. Pourtant, il est necessaire d'utiliser ces variables dans 
plusieurs cas : 

• Lorsqu'on ne connait pas la taille des variables lors de la compilation (par exemple une 
table contenant un nombre fluctuant d'elements). 

• Lorsqu'on a besoin d'allouer une zone memoire de taille importante, principalement s'il 
s'agit d'une variable locale dans une fonction susceptible d'etre invoquee de maniere 
recursive, risquant un debordement de pile si on l'alloue de maniere automatique. 

• Lorsqu'on desire gerer la memoire le plus finement possible, en reallouant les zones de 
memoire au fur et a mesure des besoins, ou en utilisant des organisations des donnees 
telles que la liste chamee, Parbre binaire, la table de hachage. . . 

Les methodes d' allocation dynamique de memoire n'ont rien de complique, mais il convient 
toutefois de prendre des precautions pour eviter les bogues de fuite memoire, qui sont surtout 
sensibles avec des processus fonctionnant pendant de longues, voire de tres longues durees. 

Utilisation de mallocQ 

Pour allouer une nouvelle zone de memoire, on utilise generalement la fonction mallocO, 
dont le prototype est declare dans <stdl i b . h> ainsi : 

void * malloc (size_t taille); 

L argument transmis correspond a la taille, en octets, de la zone memoire desiree. Le type 
size_t etant non signe, il n'y a pas de risque de transmettre une valeur negative. Si on 
demande une taille valant zero, la version Gnu de mal 1 oc( ) renvoie un pointeur NULL. Sinon, 
le systeme nous accorde une zone de la taille voulue et renvoie un pointeur sur cette zone. Si 
la memoire disponible ne permet pas de faire l'allocation, mal 1 oc( ) renvoie un pointeur NULL. 
II est fortement recommande de tester le retour de toutes les demandes d' allocation. Le code 
demandant d'allouer une nouvelle structure de type ma_struct_t serait done : 

ma_struct_t * ma_struct; 

if ( (ma_struct = malloc(sizeof(ma_struct_t))) == NULL) { 

fprintf (stderr, "Pas assez de memoire pour la structure voulue \n"); 
exit(EXIT_FAILURE); 

} 

Pendant longtemps, il etait d' usage de convertir explicitement le pointeur renvoye par 
mal 1 oc( ) a l'aide d'un cast dans le type de pointeur desire. Cette habitude disparait car elle 
ne presente pas d'utilite (mal 1 oc( ) renvoie un pointeur void * qui peut se convertir automa- 
tiquement en pointeur sur n'importe quel type de donnees). Elle peut egalement masquer 
une petite erreur : si nous oublions d'inclure <stdl ib . h>, mal 1 oc( ) est implicitement declare 
comme renvoyant une valeur de type i nt. Si nous ne faisons pas de cast explicite, le compi- 
lateur nous affichera un avertissement - ce qui nous permet de corriger l'oubli de 
<stdlib.h>. 

Le probleme qui se pose souvent au programmeur est de savoir quoi faire en cas d'echec 
d' allocation memoire. En effet, il est possible que la memoire du systeme se libere, lors de la 
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terminaison d'un processus gourmand, et que 1' allocation reussisse si on la tente de nouveau 
quelques instants plus tard, mais on peut estimer aussi que l'etat de surcharge du systeme est 
tel qu'il est probablement inutilisable, et qu'il vaut mieux terminer l'application au plus vite 
pour redonner la main a l'utilisateur, qui devra eliminer les processus consommant trop de 
ressources. L'echec d'une allocation dynamique est generalement le signe d'une fuite 
memoire dans Fun des processus en cours, et il est preferable dans tous les cas de le signaler 
a l'utilisateur. 

Malheureusement, dans certains cas extremes, le fait qu'une allocation memoire ait reussi ne 
signifie pas que le processus puisse effectivement utiliser la memoire qu'il croit disponible. 
Pour comprendre ce probleme, il est necessaire de s'interesser au mecanisme detaille de la 
gestion de la memoire virtuelle sous Linux. 

Un processus dispose d'un espace d'adressage lineaire immense, s'etendant jusqu'a 3 Go. 
Cet espace est decoupe en segments ayant des roles bien particuliers. Le processus peut 
connaitre les limites de ses segments en utilisant des variables externes remplies par le char- 
geur de programmes du noyau : 

• Le segment nomme text contient le code executable du processus ; il s'etend jusqu'a 
l'adresse contenue dans la variable _etext. Le debut de ce segment varie selon le format de 
fichier executable. Dans le segment de code se trouvent egalement les routines des biblio- 
theques partagees utilisees par le processus. 

• Le segment des donnees initialisers au chargement du processus et des donnees locales 
statiques des fonctions est nomme data. II s'etend de l'adresse contenue dans la variable 
_etext jusqu'a celle contenue dans _data. 

• Le segment des donnees non initialisees et des donnees allouees dynamiquement est 
nomme bss. II s'etend de l'adresse contenue dans _data a celle contenue dans _end. 

A l'autre bout de l'espace d'adressage se trouvent d'autres donnees comme les variables 
d'environnement et la pile du processus. Ces elements ne nous concernent pas directement 
ici. 



Figure 13.1 
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Lorsqu'on appelle la routine mal 1 oc( ), de la bibliotheque C, celle-ci invoque l'appel-systeme 
brk( ), qui est declare par le prototype suivant : 

int brk (void * pointeur_end) ; 

Cet appel-systeme permet de positionner la variable _end, modifiant ainsi la taille du segment 
bss. II existe egalement une fonction de bibliotheque nommee sbrk() et declaree ainsi : 

void * sbrk (ptrdiff_t increment); 

Celle-ci augmente ou diminue la taille du segment bss de 1' increment fourni en argument. En 
realite, mal 1 oc( ) gere elle-meme un ensemble de blocs memoire qu'elle garde a disposition 
du processus, et ne fait appel a sbrk( ) qu'occasionnellement. Lorsque 1' increment est negatif, 
sbrk( ) sert a liberer de la memoire. Le probleme - si on peut dire - est que l'appel sbrk( ) 
n'echoue que tres rarement. En effet, les cas d'erreur sont les suivants : 

• Le processus essaye de liberer de la memoire appartenant au segment de code text. 

• Le processus essaye de depasser sa limite RLIMIT_DATA fixee par la routine setrlimitO que 
nous avons vue dans le chapitre concernant l'execution des programmes. 

• La nouvelle zone de donnees va deborder sur une zone de projection memoire telle que 
nous en verrons dans le prochain chapitre. 

• L allocation demandee excede la taille de la memoire virtuelle globale du systeme (moins 
les valeurs minimales des buffers et du cache, ainsi qu'une marge de securite de 2 %). 

Le probleme principal se pose avec le dernier point. En effet, lorsque le noyau a augmente 
la taille du segment de donnees d'un processus, il n'a pas pour autant reserve de la place 
effective dans la memoire du systeme. Le principe de la memoire virtuelle fait que c'est 
uniquement au moment ou le processus tente d'ecrire dans la zone nouvellement allouee que 
le systeme declenche une faute d'acces et lui attribue une page memoire reelle. II est done 
possible de reclamer beaucoup plus de memoire que le systeme ne peut en fournir, sans pour 
autant que les allocations echouent. 



Ce comportement est du a un mecanisme nomme overcommit-memory (sur-reservation memoire) selon 
lequel on considere que les applications reclament toujours plus de memoire qu'elles n'en ont effectivement 
besoin. On accepte alors toutes les allocations si I'espace d'adressage (memoire virtuelle) du processus n'est 
pas sature, et si la taille de la demande n'excede pas la somme de la memoire physique disponible et du swap. 
Sans entrer dans les details, indiquons que cela peut eviter des attaques de securite par deni de service. 
Lorsque toute la memoire du systeme est saturee, un sous-ensemble du noyau nomme OOM-Killer (Our Of 
Memory Killer) est charge de trouver le processus responsable de la saturation et de le tuer. Cela peut poser 
des problemes de fiabilite dans des systemes critiques, aussi est-il possible - depuis le noyau Linux 2.6 - de 
desactiver la sur-reservation memoire. Pour cela il taut ecrire dans le fichier /proc/sys/vm/overcomm1t- 
memory la valeur 2. Pour plus de details, on COnsultera le fichier Documentation/vm/overcommit-acounting 

dans les sources du noyau. 



Si la machine dispose par exemple de 128 Mo de memoire virtuelle, une demande d' alloca- 
tion de 128 Mo en une fois echouera. Par contre, 128 demandes (ou plus) d'un Mo chacune 
seront acceptees tant qu'on n'aura pas essaye d'ecrire reellement dans les zones allouees. 

A titre d' exemple, ma machine actuelle contient 128 Mo de memoire vive et 128 Mo de swap. 
Meme sans prendre en compte le fait que le systeme fait tourner X-Window, Kde, un lecteur 
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de CD audio, la suite bureautique sur laquelle je redige ce texte et plusieurs Xterms, je ne 
peux vraiment pas compter disposer dans une application de plus de 256 Mo de memoire. 
Et pourtant le code suivant fonctionne sans erreur : 

exemple_malloc_1.c : 

#include <stdio.h> 
#include <stdlib.h> 

#define NB_BL0CS 257 
#define TAILLE (1024*1024) 

int 
main (void) 

{ 

int i ; 

char * bloc [NB_BL0CS] ; 

for (i = 0; i < NB_BL0CS; i ++) { 

if ((bloc[i] = malloc(TAILLE)) == NULL) { 

fprintf (stderr, "Echec pour i = £d\n", i); 
break; 

} 

} 

fprintf(stderr, "Alloues : %d blocs de %d Ko \n", i, TAILLE / 1024); 
return EXIT_SUCCESS; 

} 

En voici 1' execution : 

$ . /exemple_malloc_l 

Alloues : 257 blocs de 1024 Ko 
$ 

257 Mo alloues dans une memoire virtuelle qui n'en comporte que 256, espace de swap 
compris ! 

Si nous essayons d'utiliser les zones allouees, par contre, le comportement est different. Nous 
remplissons avec des zeros la memoire renvoyee au fur et a mesure. 

exemple_malloc_2. : 

#include <stdio.h> 
^include <stdlib.h> 

#define NB_BL0CS 257 
#define TAILLE (1024*1024) 

int 
main (void) 

{ 

int i ; 

char * bloc [NB_BL0CS]; 

for (i = 0; i < NB_BL0CS; i ++) { 
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if UblocLi] = malloc(TAILLE)) == NULL) { 

fprintf (stderr, "Echec pour i = M\n", i); 
break; 

} 

fprintf (stderr, "Rempl i ssage de M\n", i); 
memset(bloc[i], 0, TAILLE); 

} 

fprintf (stderr, "Alloues : %d blocs \n", i); 
return EXIT_SUCCESS ; 

} 

Nous lancons le programme avec l'utilitaire nice, afin d'essayer de ne pas trop bloquer le 
reste du systeme (il faut quand meme eviter de lancer ce processus sur une machine ouverte a 
plusieurs utilisateurs, le ralentissement du systeme du a Fusage intensif du peripherique de 
swap est sensible). 

$ nice . /exemple_malloc_2 

Rempl i ssage de 0 
Rempl i ssage de 1 
Rempl i ssage de 2 
Rempl i ssage de 3 
Rempl i ssage de 4 
Rempl i ssage de 5 

[.--] 
Rempl issage de 198 
Rempl issage de 199 
Rempl issage de 200 
Rempl issage de 201 
Rempl issage de 202 
Echec pour i = 203 
I Alloues : 203 blocs 
$ 

Cette fois-ci, nous voyons que le programme echoue effectivement lorsqu'il n'y a plus de 
memoire utilisable. Le probleme c'est done le risque qu'une allocation reussisse, alors qu'elle 
conduira par la suite a des degradations sensibles des performances du systeme lorsqu'on 
tentera d'utiliser les zones allouees. Pour limiter au maximum cette eventualite, on essayera 
toujours de reclamer uniquement la memoire dont on a reellement besoin au moment voulu, 
et on utilisera systematiquement les pages memoire allouees le plus vite possible. 

On pourrait etre tente d'utiliser par principe call oc( ) a la place de mallocO , car cette fonc- 
tion effectue l'initialisation a zero de toute la zone allouee. Pourtant, cela ne marcherait pas 
non plus dans certains cas. On notera tout d'abord que calloc( ) est une simple fonction de 
bibliotheque, et qu'il y a toujours un risque de voir un processus concurrent s'allouer une 
enorme zone de memoire et la remplir aussitot entre le moment ou callocO a fait appel a 
sbrk( ) et le moment oil il initialise la nouvelle memoire. Par ailleurs, pour des raisons d'effi- 
cacite, callocO ne fait pas necessairement des ecritures en memoire mais peut utiliser - 
surtout pour de grosses allocations - la fonction mmap( ) , que nous verrons dans le prochain 
chapitre, pour obtenir une zone remplie de zeros en projetant le peripherique /dev/zero. 

La seule methode vraiment efficace pour s' assurer la disponibilite des zones allouees est done 
de toujours ecrire rapidement dans les nouvelles donnees et d'eviter d'appeler successive- 
ment mal 1 oc( ) plusieurs fois de suite sans avoir rempli la memoire fournie entre-temps. 
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On pourrait legitimement se demander si F utilisation directe de sbrkO ne serait pas plus 
simple que celle de ma 1 1 oc ( ) . En fait, la presentation que nous avons faite du role de ma 1 1 oc ( ) 
- fonction de bibliotheque - vis-a-vis de l'appel-systeme brk( ) est largement simplificatrice. 
En fait, mallocO assure des fonctionnalites bien plus complexes que le simple agrandisse- 
ment de la zone de donnees pour renvoyer un pointeur sur la memoire allouee : 

• Alignement : mal 1 oc( ) garantit que la memoire fournie sera correctement positionnee afin 
de pouvoir y stocker n'importe quel type de donnee. Cela signifie que le processeur pourra 
manipuler directement les types entiers ou reels qu'on placera dans la memoire allouee. 
Sur la plupart des machines, 1' alignement des donnees est realise tous les 8 octets (taille 
d'un doubl e ou d'un 1 ong 1 ong i nt sur les x86). Sur les architectures 64 bits, Falignement 
est fixe tous les 16 octets. 

• Configuration : mal 1 oc( ) offre de nombreuses possibilites de configuration de l'algorithme 
d'allocation, notamment en ce qui concerne le seuil oil on passe d'une allocation avec 
sbrk( ) a une projection avec mmap( ). De plus, mal 1 oc( ) permet a l'utilisateur de fournir ses 
propres points d'appel qui seront invoques dans la routine. Cela permet d'inclure notre 
code de debogage personnalise au cceur me me des fonctions de bibliotheque. 

• Verification : la fonction mallocO et toutes les routines associees appliquent eventuelle- 
ment leurs propres verifications aux blocs alloues. Cela permet de s' assurer que F applica- 
tion ne contient pas de fuites de memoire. 

• Optimisation : pour eviter le supplement de travail du a l'appel-systeme sbrk( ), la fonction 
mallocO reclame des blocs plus importants que necessaire, afin de pouvoir en fournir 
directement une partie lors des invocations ulterieures. 

De plus, mal 1 oc( ) utilise souvent l'appel-systeme mmap( ) pour obtenir de gros blocs de donnees 
independants, faciles a restituer au systeme lors de leur liberation. Le fonctionnement de 
mma p ( ) n' a rien a voir avec b r k ( ) . 

Enfin, ajoutons que mallocO doit fonctionner correctement dans le cadre d'un processus 
deployant de multiples threads, en evitant les conflits d'acces simultanes a la limite de la zone 
de donnees. Pour toutes ces raisons, on voit que F implementation de la fonction mal 1 oc( ) est 
loin d'etre triviale, et que les personnalisations eventuelles devront de preference etre appor- 
tees en utilisant les points d' entree fournis par la bibliotheque GlibC plutot qu'en tentant de 
reecrire une version bricolee de cette fonction. 

Insistons sur un dernier point, avant de passer aux autres routines d'allocation memoire, qui 
concerne Futilisation de mal 1 oc( ) avec les chaines de caracteres. La bibliotheque C terminant 
toujours ses chaines de caracteres par un caractere nul, il est necessaire d'allouer un octet de 
plus pour la nouvelle chaine que la longueur desiree. Voici un exemple de fonction renvoyant 
une copie fraichement attribuee de la chaine passee en argument. II sera du ressort de la fonc- 
tion appelante de liberer la memoire occupee par la copie lorsqu'elle n'en aura plus besoin : 

char * 

alloue_et_copie_chaine (char * ancienne) 
{ 

char * nouvelle = NULL; 

if (ancienne ! = NULL) { 

nouvelle = malloc(strlen(ancienne) + 1); 
if (nouvelle != NULL) 

strcpy(nouvelle, ancienne); 
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} 

return nouvelle; 

} 

Utilisation de callocQ 

Le prototype de cal 1 oc( ) est le suivant : 

void * calloc (size_t nb_elements, size_t taille_element) ; 

Cette fonction sert principalement a allouer des tableaux. On foumit en premier argument le 
nombre d' elements a accorder, et en second la taille d'un element. En voici un exemple extre- 
mement classique : 

exemple_calloc_1.c : 

#include <stdio.h> 
#include <stdlib.h> 

int * 

calcul_fibonacci (int nombre_de_valeurs) 
{ 

int * table = NULL; 
int i; 

if ((table = cal 1 oc(nombre_de_val eurs , sizeof (int))) == NULL) { 
fprintf (stderr, "Pas assez de memoire \n"); 
exit(EXIT_FAILURE); 

} 

if (nombre_de_val eurs > 0) { 
table[0] = 1; 

if (nombre_de_val eurs > 1) { 
tabled] = 1; 

for (i = 2; i < nombre_de_val eurs ; i ++) 
tabled] = table[i - 2] + tabled' - 1]; 

} 

} 

return table; 

} 

int 

main (int argc, char * argv[]) 
{ 

int nb_valeurs; 
int * table; 
int i; 

if ((argc != 2) || (sscanf (argv[l] , . & nb_valeurs) != 1) ) { 
fprintf (stderr, "Syntaxe : %s nombre_de_val eurs\n" , argv [0]); 
exit(EXIT_FAILURE); 

} 

table = cal cul_f ibonacci (nb_valeurs) ; 
for (i =0; i < nb_valeurs; i ++) 

fprintf(stdout, "%d\n", tabled']); 
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free(table) ; 

return EXIT_SUCCESS; 

I > 

L' execution affiche, on s'en doutait, le nombre desire de termes de la suite de Fibonacci. 
$ ./exemple_calloc_l 10 



1 

1 

2 

3 

5 

8 

13 

21 

34 

55 

$ 



La fonction cal loc( ) assure aussi, comme nous l'avons evoque, que les zones allouees sont 
initialisees avec des zeros. Nous n'avons aucune garantie de ce genre avec les autres fonctions 
d'allocation. Elle est done parfois preferee a mallocO pour s'affranchir des problemes 
d'initialisation de variables, principalement lorsqu'on alloue dynamiquement des structures 
definies dans les fichiers d'en-tete d' autres modules, et qui sont susceptibles de posseder plus 
de membres que ceux qui sont utilises par l'application. L'appel de callocO permet ainsi 
d'initialiser toute la zone memoire, y compris les membres dont nous n'avons pas necessaire- 
ment connaissance. 

Nous l'avons deja precise, cal 1 oc( ) garantit que les zones allouees seront remplies avec des 
zeros, mais elle n' assure pas que cette initialisation se fera en utilisant des ecritures effectives 
dans les zones memoire recues. Lorsque la taille de la zone concedee est suffisamment impor- 
tante, callocO utilise l'appel-systeme mmapO depuis le peripherique /dev/zero. Les pages 
allouees restent alors aussi virtuelles qu'avec mal 1 oc( ) jusqu'a ce qu'on ecrive effectivement 
dedans. Pour plus de details sur ce mecanisme, on se reportera au chapitre suivant. Voici un 
exemple qui reprend le principe de exempl e_mal 1 oc_l . c : 

exemple_calloc_2.c : 

#include <stdio.h> 
#include <stdlib.h> 
#define NB_BL0CS 257 
#define TAILLE (1024*1024) 



int 
main (void) 



int i ; 

char * bloc[NB_BL0CS]; 



for (i = 0; i < NB_BL0CS; i ++) { 

if ((bloc[i] = callocd, TAILLE)) == NULL) { 
fprintf (stderr, "Echec pour i = %d\n", i); 
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break; 



fprintf(stderr, "Alloues : %d blocs de %d Ko \n", i, TAILLE / 1024); 
return EXIT_SUCCESS ; 

} 

Le systeme nous alloue toujours aussi imperturbablement 257 Mo dans une memoire virtuelle 
ne representant que 256 Mo : 

$ . /exemple_calloc_2 

Alloues : 257 blocs de 1024 Ko 

La fonction cal 1 oc( ) n'avait done pas reellement touche aux zones allouees. 

Si, par contre, nous echangeons les valeurs de NB_B LOCS et TAILLE afin d'allouer beaucoup de 
petites zones, cal 1 oc( ) utilise sbrk( ) suivi de memset( ), avec done une ecriture effective sur 
les pages allouees : 

$ nice ./exemple_calloc_3 

Echec pour i = 803352 
Alloues : 803352 blocs de 0 Ko 
$ 

L' allocation echoue done au bout d'un certain temps (196 Mo pour etre precis). 

Nous avons beaucoup insiste sur ces details d' implementation concernant l'ecriture ou non 
dans les pages allouees, mais il est important lors d'une phase de debogage de comprendre les 
phenomenes sous-jacents si les allocations memoire ont un comportement etrange. 



Utilisation de reallocQ 

II est souvent necessaire de modifier en cours de fonctionnement la taille d'une table allouee 
dynamiquement. Pour cela, la bibliotheque C propose la fonction real 1 oc( ), tres polyvalente, 
permettant de redimensionner aisement une zone de memoire dynamique. Son prototype est 
le suivant : 

void * realloc (void * ancien, size_t taille); 

Cette fonction cree une nouvelle zone de la taille indiquee et y recopie le contenu de F ancienne 
zone. Elle renvoie ensuite un pointeur sur la nouvelle zone memoire. Si la taille reclamee est 
superieure a celle de F ancien bloc, celui-ci est etendu, son contenu original se retrouvant au 
debut de la nouvelle zone. Si Fallocation echoue, real 1 oc( ) renvoie NULL mais ne touche pas 
a Fancien bloc. Si, au contraire, Fallocation memoire reussit, Fancien pointeur n'est plus 
utilisable. II faut done employer une variable de stockage temporaire : 

void * nouveau; 

nouveau = real 1 oc(bl oc_de_donnees , nouvel 1 e_tai 1 1 e) ; 
if (nouveau != NULL) 

bl oc_de_donnees = nouveau; 

el se 

fprintf (stderr, "Pas assez de memoire \n") ; 
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Si la taille est inferieure a celle de Fancien bloc, il y a liberation de memoire et l'ancienne 
zone de donnees est tronquee. Normalement une reduction ne doit pas echouer, mais cela peut 
quand meme se produire sur certains systemes oil le nouveau bloc est alloue independamment 
de l'ancien avant d'y faire une copie. C'est surtout le cas quand des elements de debogage 
importants sont ajoutes aux zones allouees. 

Si la taille demandee est nulle, toute la memoire est liberee et le pointeur renvoye est NULL. 
Symetriquement, on peut transmettre un pointeur NULL en premier argument, et real 1 oc( ) se 
conduit alors comme mall oc( ). 

La fonction real 1 oc( ) est particulierement utile lorsque des donnees doivent etre ajoutees ou 
supprimees au gre des actions de Futilisateur. Imaginons un programme de dessin vectoriel 
oil Finterface propose a Futilisateur d'ajouter ou d'effacer des lignes. Une table stockee en 
variable globale et deux routines permettront de gerer proprement la memoire : 

static ligne_t * table_lignes = NULL; 
static int nb_lignes = 0; 

int 

ajoute_l igne (void) 
{ /* 

* Cette routine renvoie le numero de la nouvelle ligne allouee 

* ou -1 en cas d'echec. 
*/ 

ligne_t * nouvelle; 

nouvelle = realloc(table_lignes, (nb_lignes + 1) * sizeof(ligne_t)); 
if (nouvelle == NULL) 

return -1; 
table_lignes = nouvelle; 
nb_lignes ++; 
return nb_lignes - 1; 

} 

void 

supprime_l igne (int numero) 

{ 

ligne_t * nouvelle; 

if ((numero < 0) | | (numero >= nb_lignes)) 
return; 

if (numero != nb_lignes - 1) 
/* 

* Si on supprime un element autre que le dernier, 

* on va recopier celui-ci dans l'ancien emplacement. 
*/ 

memcpy (& (tabl e_l ignes[numero] ) , 

& (table_lignes[nb_lignes -1]), 
sizeof (1 igne_t) ) ; 

nouvelle = realloc(table_lignes, (nb_lignes - 1) * sizeof(ligne_t)); 
if ((nouvelle ! = NULL) || (nbjignes - 1 == 0)) 

table_lignes= nouvelle; 
nb_lignes --; 

} 
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Utilisation de free() 

La plupart du temps, il faut liberer la memoire qu'on a allouee dynamiquement. Cette libera- 
tion s'effectue en invoquant la routine f ree( ) dont le prototype est : 

void free (void * pointeur); 

On transmet a freeO un pointeur sur une zone memoire qui a necessairement ete attribuee 
avec mal loc(), callocO ou real 1 oc( )'. Si on passe un pointeur NULL, f ree( ) ne fait rien (mais 
ce n'est pas une erreur). 

Une fois qu'une zone a ete liberee, il ne faut sous aucun pretexte essayer d'y faire de nouveau 
reference. De meme, il ne faut pas non plus tenter de liberer plusieurs fois de suite la meme 
zone, meme si la version Gnu peut assurer une certaine tolerance vis-a-vis de ce genre de 
bogue. II faut done se mefier de la liberation naive d'une liste chainee ainsi : 

for (ptr = debut; ptr != NULL; ptr = ptr->suivant) 
f ree(ptr) ; 

C'est une erreur grave, car le troisieme membre de for fait reference a la zone pointee par ptr 
alors meme que celle-ci a deja ete liberee. II est necessaire en fait de passer par une variable 
intermediate : 

for (ptr = debut; ptr != NULL; ptr = suite) { 
suite = ptr->suivant; 
f ree(ptr) ; 

} 

Regies de bonne conduite pour /'allocation et la liberation de memoire 

II y a certains cas oil on peut legitimement se demander s'il faut vraiment liberer la memoire 
allouee dynamiquement. Apres tout lorsqu'un processus se termine, tout son espace memoire 
se libere et retourne au systeme d' exploitation. Si une variable est allouee a une seule reprise 
pour toute la duree du programme, il n'est pas indispensable de la liberer explicitement. On 
limitera quand meme ce genre de comportement uniquement a des variables globales qui sont 
initialisers au demarrage du programme - par exemple en fonction de la valeur d'un argu- 
ment en ligne de commande, ou suivant la valeur d'une variable d'environnement. L' ideal 
serait de restreindre 1' allocation des blocs memoire qu'on ne libere pas a la fonction main( ). 
En effet, si le programme doit etre ulterieurement modifie pour etre utilise en boucle, on verra 
tout de suite le probleme lors de la mise a jour. 

En regie generate, toute variable allouee dynamiquement devra etre liberee a un moment ou a 
un autre. II est essentiel, pour eviter les fuites de memoire, d' adopter une attitude tres precau- 
tionneuse lorsque l'allocation et la liberation n'ont pas lieu dans la meme fonction, ce qui est 
souvent le cas. De meme, il faudra etre tres prudent avec les allocations dynamiques des 
membres de structures, elles aussi allouees dynamiquement. 

II est important de prendre de bonnes habitudes dans ces conditions. Nous presentons ici un 
exemple de « regies » de comportement vis-a-vis de la memoire dynamique, mais chacun est 
libre d'adopter ses propres standards, du moment qu'on reste coherent tout au long de l'appli- 
cation. 



1. Ou toute autre fonction de la bibliotheque C - par exemple tempnam( ) - qui appelle Tune de ces routines. Cette parti- 
cularite est normaleraent bien indiquee dans leur documentation. 
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• A chaque declaration d'un pointeur, on l'initialise avec NULL. Ceci concerne egalement les 
membres des structures allouees dynamiquement s'il s'agit de pointeurs. 

• Avant d'invoquer mal 1 oc( ), on verifie, eventuellement dans une condition assert( ), que 
le pointeur a allouer est bien NULL. 

• Apres tout appel de mal 1 oc() , on s'assure qu'aucune erreur n'a eu lieu, sinon on gere le 
probleme. 

• Avant de liberer un pointeur, on verifie - egalement dans unassertO - que le pointeur 
n'est pas NULL. 

• Des qu'on a libere un pointeur avec f ree( ), on le recharge immediatement avec la valeur 
NULL. 

Bien entendu, mal 1 oc( ) doit etre consideree ici comme une fonction generique, et on adoptera 
la meme attitude avec real 1 oc( ) ou cal 1 oc( ). Voici par exemple le genre de code qu'on peut 
produire : 

typedef struct element { 



struct element * suivant; 
) element_t; 

element_t * table = NULL; 
void 

insere_element (char * nom) 
{ 

element_t * nouveau = NULL; 
/* 

* Si on insere du code ici, entre 1 'initialisation 

* du pointeur et 1 'allocation de la variable, il est 

* bon d'effectuer la verification suivante. 
*/ 

assert(nouveau == NULL); 

nouveau = malloc(sizeof(element_t)) ; 

if (nouveau == NULL) { 

/* traitement d'erreur */ 

return; 

) 

nouveau->nom = NULL; 
nouveau->suivant = NULL; 

/* ... ici peut se trouver 1 'allocation de plusieurs membres ... */ 

if (nom != NULL) { 

nouveau->nom = mal 1 oc(strl en(nom) + 1); 
if (nouveau->nom != NULL) 

strcpy (nouveau->nom, nom); 
el se { 

/* traitement d'erreur */ 

f ree(nouveau) ; 

return; 



char * 



nom; 
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} 

nouveau->sui vant = table; 
table = nouveau; 



void 

supprime_el ement (char * nom) 
{ 

element_t * el em = NULL; 
element_t * prec = NULL; 



if (nom == NULL) 

return ; 
if (table == NULL) 

return ; 

for (elem = table; elem != NULL; elem = elem->suivant) { 
if (strcmp(elem->nom, nom) == 0) 

break; 
prec = elem; 

} 

if (elem == NULL) 

/* pas trouve */ 

return ; 
if (prec == NULL) 

/* pas de precedent : premier de la table */ 

table = elem->suivant; 

el se 

prec->suivant = elem->suivant; 



assert(elem->nom != NULL); 
f reetel em->nom) ; 
elem->nom = NULL; 

I* ... Eventuell ement liberation d'autres membres ... */ 
f reetel em) ; 
elem = NULL; 

} 

Bien sur, c'est de la programmation paranoi'aque et maniaque, mais c'est souvent ce genre de 
routines qui se revelent les plus robustes a F usage, meme si on perd largement en elegance 
de codage. En ce qui concerne les performances du logiciel, on remarquera que tous les tests 
peuvent etre inclus uniquement dans la version de debogage, comme c'est le cas ici avec 
l'utilisation de assert( ). De plus, on peut encadrer les initialisations par des directives condi- 
tionnelles #1fndef NDEBUG et #endif. La version de production du logiciel n'est done pas 
penalisee par des verifications compulsives et redondantes. 



Deallocation automatique avec allocaQ 

II existe une alternative a l'utilisation du couple mal 1 oc( )-f ree( ), constitute par la fonction 
all oca ( ). Celle-ci presente le meme prototype que mal 1 oc( ) : 

void * alloca (size_t taille); 
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Le fonctionnement est identique a celui de mal 1 oc( ), mais les zones de memoire ne sont plus 
allouees dans le segment de donnees, mais a l'oppose dans la pile du processus. Rappelons 
que la memoire du processus est constitute en bas du segment de code (text) et des segments 
de donnees initialisers (data) et non initialisers (bss). L' allocation avec mal 1 oc( ) fait croitre 
ce dernier segment vers les adresses les plus elevees. A 1' autre extremite de l'espace d'adres- 
sage se trouvent les variables d'environnement et les arguments de la ligne de commande, 
tout en haut des 3 Go virtuels reserves au processus. En dessous de cette zone se situe le 
segment de pile, qui croit vers le bas, vers les adresses les plus petites. 

Les donnees allouees avec all oca () sont placees dans le segment de pile du processus. 
L'avantage principal est que les zones allouees sont automatiquement liberees lors de la sortie 
de la fonction ayant invoque al 1 oca( ). II n'est plus necessaire d'appeler f ree( ), le retour de 
la fonction replace le pointeur de pile au-dessus des variables dynamiques, qui ne sont plus 
accessibles. On comprend bien d'ailleurs qu'il nefaut pas invoquer freeO sur le pointeur 
renvoye par al 1 oca ( ), les domaines de travail de ces deux fonctions etant totalement disjoints. 

II n'est pas question d'allouer dynamiquement avec all oca ( ) des variables globales ou une 
zone de memoire sur laquelle la fonction doit renvoyer un pointeur. Seules les variables utili- 
sees dans la fonction ou dans des sous-routines qu'on invoque peuvent etre allouees correcte- 
ment avec al 1 oca ( ). II ne faut pas non plus appeler directement al 1 oca ( ) dans les arguments 
d'une fonction qu'on invoque, car la zone allouee se trouverait, au sein de la pile, melangee 
avec les arguments. Ceci est interdit : 

appel_fonction (i, alloca(struct element)); 

Par contre, on peut utiliser : 

struct element * elem; 
elem = allocatstruct element); 
appel_fonction(i , elem); 

Le probleme principal que pose al 1 oca ( ) est la gestion d'erreur. En effet, le systeme allouant 
automatiquement les pages necessaires pour la pile, la seule erreur susceptible de se produire 
est le manque soudain de memoire disponible. Le programme se retrouve dans la meme situa- 
tion que s'il avait invoque en boucle infinie une routine recursive. Le processus risque alors de 
depasser sa limite de taille maximale de pile RLIMIT_STACK renvoyee par getrl imit( ). II y a 
peu de chances que la gestion d'erreur classique (retour non NULL) fonctionne. Au contraire, le 
programme va recevoir un signal SIGSEGV qui le tuera. Voici un exemple de ce carnage : 

exemple_alloca.c : 

#include <stdio.h> 
void 

fonction_recursive (int iteration) 

{ 

char * bloc; 

fprintf (stdout, "Iteration %d\n" , iteration); 
f f 1 ush(stdout) ; 

if ((bloc = alloca(512 * 1024)) == NULL) { 
fprintf (stdout, "Echec \n"); 
return; 

} 
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fonction_recursive(iteration + 1); 

} 

int 
main (void) 
{ 

fonction_recursive(l) ; 
return EXIT_SUCCESS ; 

} 

Avant d'appeler la fonction, nous invoquons lacommande ul imit -s du shell, qui nous donne 
la limite de taille de pile, en kilo-octets. 



$ ulimit 


s 


8192 




$ . /exemple_«lloca 


Iteration 


1 


Iteration 


2 


Iteration 


3 


Iteration 


4 


Iteration 


5 


Iteration 


6 


Iteration 


7 


Iteration 


8 


Iteration 


9 


Iteration 


10 


Iteration 


11 


Iteration 


12 


Iteration 


13 


Iteration 


14 


Iteration 


15 


Iteration 


16 


Segmentation fault 



La limite etant de 8 192 Ko, soit 8 Mo, il est logique que notre programme ne puisse allouer 
correctement son seizieme bloc de 512 Ko. Toutefois, on aurait prefere que allocaO nous 
renvoie simplement une valeur d'echec, plutot que de voir le processus arrete par un signal. 

Un autre gros avantage de al 1 oca ( ) est de permettre la liberation automatique meme lorsqu'il 
y a un saut non local depuis une sous-routine. Imaginons un interpreteur de commandes. La 
routine principale est celle ou on revient en cas de probleme de syntaxe. Lorsqu'on decom- 
pose les commandes saisies pour les analyser, on fait appel a des sous-routines d' analyse lexi- 
cale. Si l'une de ces sous-routines decouvre une erreur (mauvaise utilisation d'un mot cle 
reserve), elle peut declencher un saut non local sigl ongjmp( ) pour revenir directement auplus 
haut niveau de 1' interpreteur. Un probleme se poserait alors pour les routines intermediaries si 
elles ont alloue des donnees avec mal 1 oc( ). Elles ne sont pas rappelees car l'analyseur lexical 
ne revient pas, et les donnees allouees ne sont pas liberees. II est alors pratique d'utiliser des 
allocations avec liberation automatique al 1 oca ( ). Voici un exemple tres simplifie : 

void 

interpreteur (void) 
( 
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int erreur; 
while (1) { 

erreur = sigsetjmp(environnement_saut, 1); 

if (erreur != 0) { 

/* afficher un message d'erreur */ 

} 

/* Saisie d'une commande */ 

/* Appel de l'analyseur syntaxique */ 

/* Execution des commandes */ 

} 

} 



void 

analyse_syntaxique (char * chaine); 

{ 

commande_t * table = NULL; 
commande_t * nouvelle = NULL; 
int cmd; 



/* construit une liste des commandes rencontrees */ 
while (1) { 

/* si fin de chaine : retour */ 

/* appel de l'analyseur lexical */ 

nouvelle = alloca(sizeof(commande_t)); 
nouvel 1 e->suivante = table; 
table = nouvel le; 




void 

analyse_lexicale (char * chaine) 
{ 

/* extraction des mots */ 

/* si erreur d'entree sortie -> retour a la boucle principale */ 
if (erreur) { 

sigl ongjmp(envi ronnement_saut , 1 ) ; 

} 

/* reste du traitement */ 

} 

Le fait d'utiliser al 1 oca( ) au lieu de mal 1 oc( ) permet dans ce cas une liberation de la liste des 
commandes, car le saut non local restitue le pointeur de pile a la meme position que durant 
Finvocation originale de sigsetjmp( ). Meme si on ne repasse pas par l'analyseur syntaxique, 
ses variables dynamiques sont liberees. Rappelons quand meme que l'utilisation des sauts 
non locaux rend les programmes difficiles a lire et a deboguer, et qu'il vaut mieux les eviter 
au maximum. 
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Un dernier desagrement de all oca ( test un leger manque de portabilite. Cette fonction est 
presente sur de nombreux systemes Unix, mais elle n'est pas mentionnee dans les standards 
habituels. 

Debogage des allocations memoire 

Dans un monde ideal, l'utilisation prudente de mal 1 oc( ) et de f ree( ) avec une verification a 
chaque appel de l'etat des pointeurs devrait suffire a eviter tout bogue de fuite de memoire. 
Malheureusement, il en est rarement ainsi, et il existe toujours un risque d'erreur dans un pro- 
gramme oil les variables sont allouees dynamiquement dans un module pour etre liberees 
dans un autre module. C'est le cas, par exemple, pour toutes les routines utilitaires qui ren- 
voient un pointeur sur un bloc memoire fraichement alloue, contenant les donnees desirees. 
Nous avons cree des fonctions de ce genre dans le chapitre sur les entrees-sorties, en guise de 
frontaux pour sprintf ( ) et fgets( ). A chaque utilisation de ces routines, il faut penser a libe- 
rer la memoire renvoyee. Pour entretenir la confusion, il y a d'autres routines qui renvoient un 
pointeur sur des donnees statiques, a ne surtout pas liberer. 

Meme si le programme semble se comporter parfaitement, on aimerait quand meme avoir la 
certitude que la memoire est correctement geree. L' observation « externe » du processus est 
malheureusement insuffisante, comme nous allons le verifier. Nous allons creer un petit pro- 
gramme qui prend en argument deux valeurs et cree un tableau ayant le nombre d' elements 
mentionnes en premier argument, chaque element ayant la taille fournie en second argument. 
Ce programme invoque la commande ps pour afficher son propre etat avant et apres alloca- 
tion. Ensuite, il libere tous les elements, sauf le dernier alloue, et invoque ps. Puis il libere le 
dernier element et affiche une derniere fois le resultat de ps. Nous analyserons ensuite son 
comportement suivant les diverses valeurs passees en argument. Bien sur, nous remplirons les 
blocs alloues pour nous assurer qu'ils sont bien attribues physiquement au processus. 

exemple_memoire.c : 

#i include <stdio.h> 
//include <stdlib.h> 
#i include <unistd.h> 

int 

main (int argc, char * argv[]) 
{ 

char 1 igne_ps[80] ; 
char ** table = NULL; 

int i ; 

int nb_blocs; 

int taille_bloc; 

if ((argc != 3) 
|| (sscanf(argv[l], "%d", & nb_blocs) != 1) 
j (sscanf(argv[2], "%d", & taille_bloc) != D) { 

fprintf (stderr, "Syntaxe : %s Nb_blocs Taille \n", argv[0]); 
exit(EXIT_FAILURE); 

1 

if ((nb_blocs < 1) || (taille_bloc < 1) ) { 
fprintf (stderr, "Valeurs invalides \n"); 
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exit(EXIT_FAILURE); 

sprintf (ligne_ps, "ps un £ld", (long) getpidO); 
fprintf (stdout, "Je demarre. . .\n") ; 
systemd igne_ps) ; 

fprintf (stdout, "J'alloue %d blocs de %d octets...", 

nb_blocs, taille_bloc) ; 
ff 1 ush(stdout) ; 



table = calloc(nb_blocs, sizeof(char *)); 
if (table == NULL) { 

fprintf (stderr, "Echec \n"); 

exi t( EXIT_FAI LURE) ; 

} 

for (i = 0; i < nb_blocs; i ++) { 
table[i] = malloc(taille_bloc); 
if (table[i] == NULL) { 

fprintf (stdout, "Echec \n"); 
exi t(EXIT_ FAILURE); 

} 

memset(tabl e[i ] , 1, taille_bloc) ; 

} 

fprintf (stdout, "0k\n"); 
systemd igne_ps) ; 



fprintf (stdout, "Je libere tous les blocs sauf le dernier \n"); 
for (i = 0; i < nb_blocs - 1; i ++) 

free(table[i]) : 
systemd igne_ps) ; 



fprintf (stdout, "Je libere le dernier bloc. \n"); 
free(table[nb_blocs - 1]); 
systemd igne_ps) ; 
return EXIT_SUCCESS; 

} 

Nous allons faire deux experiences : tout d'abord, nous essaierons deux allocations avec un 
petit nombre de gros blocs, puis nous reclamerons de nombreux petits blocs. Les champs qui 
nous interessent dans la commande ps sont VSZ et RSS, qui representent respectivement la 
taille totale de memoire virtuelle utilisee par le processus et la place occupee en memoire 
physique. 

$ . / exemp 1 e_memo i r e 

Syntaxe : . /exempl ejemoi re Nb_blocs Taille_bloc 



$ ./exemple_memoire 100 1048576 

Je demarre. . . 

USER PID %CPU SSMEM VSZ RSS STAT START TIME COMMAND 
500 657 0.0 0.2 1052 376 S 13:21 0:00 . /exempl ejnemoi re 
J'alloue 100 blocs de 1048576 octets... 0k 
USER PID %CPU ftMEM VSZ RSS STAT START TIME COMMAND 
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500 657 24.0 74.2 103852 95100 S 13:21 
Je libere tous les blocs sauf le dernier 

USER PID %CPU 2JMEM VSZ RSS STAT START 

2080 1204 S 13:21 
bloc. . 

VSZ RSS STAT START 

1052 176 S 13:21 



500 657 24.2 0.9 
Je libere le dernier 
USER PID %CPU %MEM 

500 657 24.2 0.1 



0:02 ./exemple_memoire 

TIME COMMAND 

0:02 ./exemple_memoire 

TIME COMMAND 

0:02 ./exemple_memoire 



$ . /exemple_memoire 100 1048576 

USER PID %CPU %MEM VSZ RSS STAT START 

500 662 0.0 0.2 1052 376 S 13:21 
J'alloue 100 blocs de 1048576 octets... Ok 
USER PID %CPU %MEM VSZ RSS STAT START 

500 662 53.5 80.6 103852 103204 S 13:21 
Je libere tous les blocs sauf le dernier 
USER PID %CPU %MEM VSZ RSS STAT START 

500 662 36.0 1.1 2080 1432 S 13:21 
Je libere le dernier bloc. 
USER PID %CPU %MEM VSZ RSS STAT START 

500 662 36.0 0.3 1052 404 S 13:21 



TIME COMMAND 

0:00 . /exemple_memoire 

TIME COMMAND 

0:01 ./exemple_memoire 

TIME COMMAND 

0:01 ./exemple_memoire 

TIME COMMAND 

0:01 . /exemple_memoire 



$ ./exemple_memoire 102400 1024 
Je demarre. . . 

USER PID SSCPU 5SMEM VSZ RSS STAT START 

500 667 0.0 0.2 1052 376 S 13:22 
J'alloue 102400 blocs de 1024 octets... Ok 

USER PID %CPU %MEM VSZ RSS STAT START 

500 667 31.2 81.2 104656 104008 S 13:22 
Je libere tous les blocs sauf le dernier 

USER PID %CPU %MEM VSZ RSS STAT START 

500 667 26.6 81.2 104656 104008 S 13:22 
Je libere le dernier bloc. 

USER PID SSCPU JJMEM VSZ RSS STAT START 

500 667 27.0 0.6 1456 808 S 13:22 



TIME COMMAND 

0:00 ./exemple_memoire 

TIME COMMAND 

0:01 . /exemple_memoire 

TIME COMMAND 

0:01 . /exemple_memoire 

TIME COMMAND 

0:01 . /exemple_memoire 



$ 

Nous voyons que durant les deux premieres invocations, nous reclamons 100 blocs d'un mega- 
octet chacun (1 048 576 octets). Pourtant, les deux invocations successives ne conduisent pas 
a la meme occupation memoire physique. Le systeme avait profite de la premiere invocation 
pour swapper des processus inutilises (dont le traitement de texte que j 'utilise pour ecrire ces 
lignes !), et il disposait alors de plus de place des le demarrage de la seconde invocation. 

Le fait de ne pas liberer le dernier bloc n'a pas de repercussions sur les liberations prece- 
dentes. La taille des blocs (1 Mo) etant plus grande que la limite M_MAP_THRESH0LD (128 Ko) 
que nous rencontrerons dans le prochain paragraphe, l'algorithme de mallocO utilise des 
projections en memoire avec mmap( ), independantes les unes des autres. 

Lors de la troisieme invocation, nous allouons 100 K-blocs d'un kilo-octet chacun. La taille 
memoire est done identique a celle des deux premieres experiences. Pourtant, la taille de 
l'espace utilise, tant en memoire virtuelle que physique, est modifiee. C'est du a l'algorithme 
de mal 1 oc( ). Les blocs etant plus petits qu'une page memoire, il les attribue par groupes, en 
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utilisant sbrk( ). Les blocs sont done « empiles » les uns au-dessus des autres, le dernier se 
trouvant au sommet. Lorsque nous liberons toute la memoire, sauf le dernier bloc, mal 1 oc( ) 
ne peut toujours pas faire redescendre la limite _end du segment de donnee, et nous voyons 
que la memoire liberee n'est toujours pas revenue au systeme d' exploitation. Ce n'est qu'avec 
la derniere liberation que la memoire est restituee au noyau. 

La conclusion de cette experience est qu'il est difficile de verifier depuis l'exterieur si un 
programme contient des fuites de memoire. II est necessaire de disposer d'outils integres aux 
routines d'allocation pour surveiller le processus. C'est ce que nous verrons dans une prochaine 
section. 

Configuration de I'algorithme utilise par mallocQ 

La fonction mal 1 opto est declaree ainsi dans <mal 1 oc. h> : 

int mallopt (int parametre, int valeur); 

Cette fonction permet de preciser une valeur pour un des parametres utilises par les routines 
d'allocation et de liberation. Elle renvoie 1 si elle reussit, et 0 sinon. Les parametres qu'on 
peut transmettre a mal 1 opt( ) sont definis par les constantes symboliques suivantes : 





Constante 


Parametre 


M. 


_MMAP 


_MAX 


Le nombre maximal de blocs qui sont alloues en utilisant I'appel-systeme mmap( ) et non 
sbrk( ). Ce parametre peut etre mis a zero pour empecher toute utilisation de mmapO. Sur 
certains systemes, la capacite de projection avec mmapO peut etre limitee. La valeur par 
defaut est de 1 024. 


M. 


_MMAP 


.THRESHOLD 


II s'agit de la taille de bloc a partir de laquelle on utilise mmapO et non plus sbrkO. 
L'avantage de I'emploi de mmapO est que la memoire ainsi allouee retourne au systeme 
d'exploitation (nous I'avons observe) des sa liberation. L'inconvenient est que certains 
systemes peuvent etre limites en capacite de projection avec mmapO. Dans un contexte 
multithread, il est interdit de fixer le seuil a une valeur trop grande, car on risquerait de faire 
croitre exagerement le segment de donnees, ce qui poserait des problemes d'emplacement 
des multiples piles. Le seuil par defaut vaut 128 Ko. 


M. 


_T0P_ 


PAD 


Ce parametre precise le volume memoire supplementaire que mallocO reclame au 
systeme lorsqu'elle appelle sbrkO. Cette memoire supplementaire sera done disponible 
directement dans la fonction de bibliotheque lors des prochaines allocations sans avoir 
besoin d'invoquer I'appel-systeme. Par defaut, cette valeur est nulle. 


M. 


.TRIM 


.THRESHOLD 


II s'agit de la taille minimale d'un bloc a liberer pour qu'on appelle sbrk( ) avec une valeur 
negative. Pour eviter le surcout d'un appel-systeme, freeO ne libere effectivement la 
memoire que lorsque le bloc est suffisamment consequent. La valeur par defaut est de 1 28 Ko. 



On peut obtenir exactement les memes effets en definissant, avant le premier appel a l'une des 
fonctions de la famille mallocO, les variables d'environnement suivantes (eventuellement 
depuis le shell) : 

• MALLOC_MMAP_MAX_ 

• MALL0C_MMAP_THRESH0LD_ 

• MALL0C_T0P_PAD_ 

• MALL0C_TRIM_THRESH0LD_ 
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Precisons quand meme que la modification des parametres de configuration de l'algorithme 
utilise par mal 1 oc( ) est rarement necessaire. Seuls des programmes effectuant de nombreuses 
allocations dynamiques dans des circonstances assez critiques peuvent avoir besoin de modi- 
fier ces donnees. Notons egalement qu'il n'est pas possible de lire les valeurs en cours. Les 
valeurs par defaut sont codees directement dans le fichier source mal 1 oc . c de la bibliotheque 
GlibC. 

Suivi integre des allocations et des liberations 

Nous avons remarque precedemment que F observation externe des processus en cours d' exe- 
cution ne permettait pas de verifier precisement si les allocations et liberations ne recelaient 
pas de fuites de memoire. Les versions de mal 1 oc( ), cal 1 oc( ), real 1 oc( ) et f ree( ) contenues 
dans la GlibC permettent d'enregistrer automatiquement toutes leurs actions dans un fichier 
externe. Ce fichier n'est pas congu pour etre lu directement par un utilisateur mais pour etre 
analyse automatiquement par le script Perl /usr/bin/mtrace fourni avec la GlibC. Pour 
activer le suivi, il faut appeler la fonction mtraceO, dont le prototype est declare dans 
<mcheck. h> : 

void mtrace (void) ; 

Pour arreter le suivi, on appelle muntrace( ) : 

void muntrace(void) ; 

Nature llement, on active souvent le suivi des le debut de la fonction mai n ( ), et on ne le desac- 
tive pas. Mais on peut ainsi retreindre le champ de 1' analyse a une fonction particuliere. 

Lorsque mtrace( ) est appelee, elle recherche dans la variable d'environnement MALLOC_TRACE 
le nom d'un fichier sur lequel l'utilisateur a un droit d'ecriture. Si le fichier existe, il est 
ecrase. Si MALLOC_TRACE n'est pas presente dans l'environnement du processus, ou si elle 
contient un nom de fichier invalide pour l'ecriture, ou encore si le processus est installe avec 
les bits Set-UID ou Set-GID, mtrace( ) n'a pas d'effet. 

Sinon, elle configure des routines specifiques dans les points d'acces des routines mallocO, 
real 1 oc( ) et f ree( ), comme nous le verrons dans un prochain paragraphe. A chaque invoca- 
tion de ces fonctions, des informations de debogage sont inscrites dans le fichier. A la fin du 
processus, on peut appeler l'utilitaire mtrace avec le nom de l'executable en argument, suivi 
du fichier de trace. II presente alors les problemes eventuels qui ont ete detectes. Dans le 
programme de test suivant, nous introduisons une allocation a deux reprises dans le meme 
pointeur (done la premiere memoire ne peut pas etre liberee). 

exemple_mtrace_1.c : 

#i include <stdio.h> 
#include <stdlib.h> 
#include <mcheck.h> 

int 
main (void) 
{ 

char * ptr; 



mtrace( ) ; 



Gestion de la memoire du processus 

Chapitre 13 



if C(ptr = malloc(512)) == NULL) { 
perror( "mal 1 oc" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

/* On ecrase ptr, la premiere zone n'est plus liberable */ 
if ((ptr = malloc(512)) == NULL) { 

perror( "mal 1 oc" ) ; 

exi t(EXIT_FAI LURE); 

} 

f ree(ptr) ; 

return EXIT_SUCCESS; 

} 

Et voici un exemple de session de debogage : 

$ export MALLOC_TRACE="trace.out" 

$ ./exemple_mtrace_l 

$ mtrace exemple_mtrace_l trace. out 

Memory not freed: 



Address Size Caller 
0x08049750 0x200 at /home/ccb/src/ProgLi nux/13/exempl e_mtrace_l . c : 13 

La sortie de mtrace indique le fichier source fautif, ainsi que le numero de ligne. Si on ne 
fournit pas le nom du fichier executable, mtrace affiche des resultats moins lisibles : 

$ mtrace trace. out 

Memory not freed: 



Address Size Caller 
0x08049750 0x200 at 0x80484b5 
$ 

Lorsque le programme ne presente pas de defaut, mtrace l'indique. 
exemple_mtrace_2.c : 

#include <stdio.h> 
finclude <stdlib.h> 
#include <mcheck.h> 

int 
main (void) 

{ 

char * ptr; 
mtrace( ) ; 

if ((ptr = malloc(512)) == NULL) { 
perror( "mal 1 oc" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

f ree(ptr) ; 

return EXIT_SUCCESS; 

} 
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Ici on nous indique qu'il n'y a pas de fuite de memoire : 

$ export MALLOC_TRACE=" trace. out" 
$ . /exemple_mtrace_2 
$ mtrace trace. out 

No memory leaks. 
$ 

Nous avons signale que lorsque mtrace( ) est invoquee sans que la variable d'environnement 
MALLOC_TRACE ne contienne de nom de fichier correct, la fonction ne faisait rien. Ce n'est pas 
pour autant une raison pour appeler systematiquement mtrace ( ) au debut de nos programmes. 
En effet, il y aura un conflit le jour oil on lancera, sans y penser, le programme durant une 
session de debogage d'une autre application. La variable d'environnement pointant vers le 
meme fichier de suivi, les traces des deux processus seront inextricablement melangees. La 
meilleure attitude a adopter est d'encadrer l'appel a mtrace( )par des directives de compilation 
conditionnelles : 

#ifndef NDEBUG 

mtrace( ) ; 
#end1f 

Ainsi, lorsque la phase de debogage sera terminee, une recompilation permettra d'eliminer 
automatiquement l'appel a mtraceO du code de distribution. II est important de remarquer 
qu'une fois que mtraceO a ete appelee, l'ensemble des fonctions de bibliotheque qui invo- 
quent mallocO sont egalement concernees par le suivi. II peut s'agir bien entendu de la 
GlibC, mais egalement de n'importe quelle autre bibliotheque utilisee par le programme. 
Certaines de ces fonctions peuvent allouer de la memoire qu'elles libereront en une seule fois, 
a la fin du processus, avec une routine enregistree par atexi t( ). Si on utilise tnuntrace( ) avant 
que la fonction main( ) ne se termine, on risque d'obtenir des messages d'alarme excessifs de 
mtrace. On a done interet a eviter au maximum l'appel de muntrace( ), sauf lorsqu'on desire 
deboguer une partie precise du programme. 

Notons aussi que mtrace( ) indique toutes les variables dynamiques allouees mais qui n'ont 
pas ete liberees explicitement. Or, il arrive frequemment, tant dans les programmes applica- 
tifs que dans les bibliotheques systeme, que des buffers soient alloues automatiquement au 
lancement du processus, mais qu'ils ne soient pas liberes avant que la fin du programme ne 
restitue toute la memoire au systeme. On ne s'etonnera done pas que ces allocations soient 
signalees a chaque fois. La surveillance des programmes utilisant par exemple les bibliothe- 
ques Xlib, Xt ou les fonctions reseau de la bibliotheque C est rendue un peu penible. En regie 
generale, on ne s'occupera que des allocations de son propre programme, qu'on filtrera avec 
/bi n/grep. 

Surveillance automatique des zones allouees 

La fonction mcheck( ) est declaree dans <mcheck. h> ainsi : 

int mcheck (void (* fonction_d_erreur) (enum mcheck_status status)); 

On passe a cette routine un pointeur sur une fonction qui sera automatiquement invoquee 
lorsque l'une des fonctions de la famille mal 1 oc( ) detecte une incoherence dans un bloc de 
memoire dynamique. Si on passe un pointeur NULL, mcheck( ) installe un gestionnaire d'erreur 
par defaut qui affiche simplement un message sur stderr avant d'invoquer abort( ). 
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Comme la fonction mcheck( ) installe des routines de verification dans les points d'entree des 
fonctions d' allocation, elle doit etre appelee avant toute utilisation de mal 1 oc( ). II faut done la 
placer le plus tot possible dans la fonction main( ). Cela peut poser un probleme en C++, ou 
les constructeurs d'objets statiques peuvent appeler mal 1 oc( ) avant F entree dans la fonction 
mainO. On peut alors utiliser Foption -lmcheck au moment de F edition des liens du 
programme, ce qui correspond a un mcheck( NULL) des 1' initialisation du processus. 

Si mcheck( ) reussit, elle renvoie 0, si elle echoue parce qu'on l'a appelee trop tard - autrement 
dit apres un premier mal 1 oc( ) - elle renvoie -1. Les verifications ont lieu automatiquement 
lorsqu'on invoque une des fonctions de la famille mal 1 oc( ), mais on peut egalement demander 
un controle immediat d'un bloc memoire en utilisant mprobe( ) declaree ainsi : 

void mprobe(void * pointeur); 

On lui transmet bien entendu un pointeur sur la zone a tester. Lorsqu'une erreur est detectee, 
notre routine est appelee avec en argument Fune des valeurs suivantes : 



Valeur 


Signification 


MCHECK. 


.DISABLED 


mcheck( ) a ete appelee trop tard, on ne peut plus faire de verification. Cette valeur n'est 
transmise que sur une demande mprobe( ). 


MCHECK. 


_0K 


Pas d'erreur. 


MCHECK. 


.HEAD 


On a detecte que le bloc de memoire place juste avant celui qu'on examine a ete ecrase. C'est 
un cas courant de boucle dans laquelle le compteur est descendu par erreur jusqu'a -1 au lieu 
de s'arreter a zero. 


MCHECK. 


JAIL 


Inversement, le bloc de memoire place apres celui qu'on surveille a ete touche. Cela peut se 
produire par exemple lorsqu'on alloue dynamiquement la memoire pour une chaine en 
oubliant de compter le caractere nul final. 


MCHECK. 


.FREE 


Le bloc examine a deja ete libere. 



Voyons un exemple de surveillance automatique. 
exemple_mcheck_1.c : 

#include <stdio.h> 
#include <stdlib.h> 
^include <mcheck.h> 



void fonction_d_erreur (enum mcheck_status status); 

#define NB_INT 20 

int 
main (void) 

{ 

int * table_int; 
int i ; 

if (mcheck(fonction_d_erreur) != 0) { 
perror( "mcheck" ) ; 
exi t( EXIT_FAI LURE) ; 

} 
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fprintf (stdout, "Allocation de la table \n"); 
table_int = calloc(NB_INT, sizeof ( int) ) ; 

fprintf (stdout, "On deborde vers le haut \n"); 
for (i = 0; i <= NB_I NT ; 1 ++) 
table_int[i] = 1; 

fprintf (stdout, "Liberation de la table \n"); 
f reettabl e_int) ; 

fprintf (stdout, "Allocation de la table \n"); 
table_int = calloc(NB_INT, sizeof ( int) ) ; 

fprintf (stdout, "On deborde vers le bas \n"); 
i = NB_I NT ; 
while (i >= 0) 

table_int[--i] = 1; 

fprintf (stdout, "Liberation de la table \n"); 
free(table_int) ; 

fprintf (stdout, "Allocation de la table \n"); 
table_int = calloc(NB_INT, sizeof ( int) ) ; 

fprintf (stdout, "Ecriture normale \n"); 
for (i = 0; i < NB_I NT ; i ++) 
table_int[i] = 0; 

fprintf (stdout, "Liberation de la table \n"); 
f reettabl e_int) ; 

fprintf (stdout, "Et re-liberation de la table ! \n"); 
f reettabl e_int) ; 
return EXIT_SUCCESS; 



void 

fonction_d_erreur (enum mcheck_status status) 
{ 

switch(status) { 

case MCHECK_DISABLED : 

fprintf (stdout, " -> Pas de verification \n"); 

break; 
case MCHECK_0K : 

fprintf (stdout, " -> Verification Ok \n"); 

break; 
case MCHECKJEAD : 

fprintf (stdout, " -> Donnees avant un bloc ecrasees \n"); 

break; 
case MCHECK_TAIL : 

fprintf (stdout, " -> Donnees apres un bloc ecrasees \n"); 

break; 
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case MCHECK_FREE : 

fprintf (stdout, " -> Bloc deja libere \n"); 
break; 

} 

} 

Voici 1' execution de notre programme : 

$ . /exempl e_mcheck_l 

Allocation de la table 
On deborde vers le haut 
Liberation de la table 

-> Donnees apres un bloc ecrasees 
Allocation de la table 
On deborde vers le bas 
Liberation de la table 

-> Donnees avant un bloc ecrasees 
Allocation de la table 
Ecriture normal e 
Liberation de la table 
Et re-liberation de la table ! 

-> Bloc deja libere 
Segmentation fault (core dumped) 
$ 

Notons que 1' arret brutal du programme est du a la double liberation du dernier pointeur. 
Cette erreur avait ete detectee lors de l'appel de f ree( ), mais comme nous n'avons rien fait 
d' autre que d'afficher un message, la seconde tentative de liberation a eu lieu normalement. 

II est aussi possible de demander aux routines d' allocation d'effectuer le meme genre de 
surveillance simplement en definissant la variable d'environnement MALLOC_CHECK_. Des que 
cette variable est definie, les routines d' allocation deviennent plus tolerantes, permettant les 
multiples liberations d'un meme bloc ou les debordements d'un octet en haut ou en bas d'un 
bloc. Ensuite, en fonction de la valeur de MALLOC_CHECK_, le comportement varie lorsqu'une 
erreur est rencontree : 

• Si MALLOC_CHECK_ vaut 1, un message est inscrit sur la sortie d' erreur standard. 

• Si MALLOC_CHECK_ vaut 2, le message est inscrit, puis le processus est arrete avec un abort( ). 
Le fichier core cree permettra de retrouver l'endroit oil l'erreur s'est produite. 

• Pour toute autre valeur de MALLOC_CHECK_, l'erreur est silencieusement ignoree. Autant dire 
que ce n'est pas une methode raisonnable pour eliminer un dysfonctionnement (quoique 
cela assure une certaine protection pendant une demo !). 

Le programme exempl e_mcheck_2.c effectue les memes operations que exempl e_mcheck_l .c, 
mais il ne met pas en place de gestionnaire d' erreur. De plus, la table allouee contient des 
caracteres et non plus des entiers, ce qui permet de rentrer dans le cadre de tolerance de 
MALLOC_CHECK_ pour les debordements d'un octet. Voici un exemple d'execution de ce 
programme avec diverses configurations de la variable d'environnement : 

$ unset MALLOC_CHECK_ 
$ . /exempl e_mcheck_2 

Allocation de la table 
On deborde vers le haut 
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Liberation de la table 

Allocation de la table 

On deborde vers le bas 

Liberation de la table 

Segmentation fault (core dumped) 

$ export MALL0C_CHECK_=1 

$ ./exemple_mcheck_2 

Allocation de la table 

malloc: using debugging hooks 

On deborde vers le haut 

Liberation de la table 

freeO: invalid pointer 0x8049830! 

Allocation de la table 

On deborde vers le bas 

Liberation de la table 

freeO: invalid pointer 0x8049850! 

Allocation de la table 

Ecriture normale 

Liberation de la table 

Et re-liberation de la table ! 

freeO: invalid pointer 0x8049870! 

$ export MALL0C_CHECK_=2 

$ ./exemple_mcheck_2 

Allocation de la table 

On deborde vers le haut 

Liberation de la table 

Aborted (core dumped) 

$ export MALL0C_CHECK_=0 

$ . /exempl e_mcheck_2 

Allocation de la table 

On deborde vers le haut 

Liberation de la table 

Allocation de la table 

On deborde vers le bas 

Liberation de la table 

Allocation de la table 

Ecriture normale 

Liberation de la table 

Et re-liberation de la table ! 

$ 

La premiere execution (MALL0C_CHECK_ non definie) echoue lors de la tentative de double libe- 
ration du pointeur. La seconde (valeur 1) affiche les erreurs, mais les tolere. La troisieme 
execution (valeur 2) affiche les erreurs et s'arrete des qu'une incoherence est rencontree. 
Enfin, la derniere execution (valeur quelconque, 0 en 1' occurrence) autorise toutes les erreurs 
sans afficher de message. 

Fonctions d'encadrement personnalisees 

Nous avons indique que les fonctionnalites de surveillance, comme mcheck( ) , utilisent des 
points d' entree dans les routines d' allocation et de liberation pour inserer leur code. Mais 
nous pouvons egalement utiliser ces points d' entree pour y glisser nos propres fonctions de 
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supervision. Ce genre de procede de debogage est relativement pointu et n'est generalement 
necessaire que pour des logiciels vraiment consequents, ou un processus particulier est, par 
exemple, charge de surveiller le deroulement de ses confreres. L'insertion d'une routine de 
debogage se fait en utilisant les variables globales suivantes, declarees dans <mal 1 oc . h> : 



Variable Utilisation 

_mal 1 oc_hook Pointeur sur une fonction du type 

void * fonction (size_t taille, void * appelant) 

Cette routine sera appelee a la place de mal 1 oc( ) ; elle regoit en argument la taille de bloc a 
allouer et un pointeur contenant I'adresse de retour, ce qui permet de retrouver I'emplacement 
de I'appel fautif si une erreur est detect.ee. Cette fonction doit renvoyer un pointeur sur la zone 
de memoire nouvellement allouee. Nous montrerons plus bas comment invoquer I'ancienne 
routine d'allocation pour obtenir le bloc memoire desire. 

_real 1 oc_hook Pointeur sur une routine de type 

void *fonction(void *ancien,size_t taille, void *appel ) 
Cette fonction sera appelee lorsqu'on invoquera real 1 oc( ) et devra s'occuper de redimension- 
ner I'ancien bloc avec la nouvelle taille desiree. L'emplacement ou on a fait appel a real 1 oc( ) 
est transmis en troisieme argument pour retrouver une eventuelle erreur. 

_f ree_hook Pointeur sur une routine de type 

void fonction (void * pointeur, void * appelant) 

chargee de liberer le bloc de memoire correspondant au pointeur transmis. 



Nous avons parle de fonctions d'encadrement personnalisees, et non de fonctions d'allocation 
et de liberation personnalisees. En effet, bien qu'il soit possible d'ecrire nos propres routines 
de gestion complete de la memoire, ce travail serait tres difficile, et nous allons nous contenter 
d'inserer du code servant de tremplin pour I'appel des veritables routines mal 1 oc( ), real 1 oc( ) 
et free( ). Dans notre exemple, nous nous contenterons d'afficher sur la sortie d'erreur stan- 
dard les appels effectues. Les routines d'encadrement pourraient etre bien plus subtiles, en 
verifiant l'integrite des blocs memoire par exemple, comme nous le verrons plus loin. 

Pour pouvoir faire appel aux routines originales mal 1 oc( ), real 1 oc( ) ou f ree( ), il est neces- 
saire de stocker dans des variables globales les valeurs initiales des points d'entree. Lorsque 
nous desirerons les invoquer, il suffira de restituer les valeurs originales des points d'entree et 
de faire un appel normal a la fonction concernee. Comme nous ne connaissons pas les inter- 
dependances entre les routines de la bibliotheque, il faudra a chaque fois sauver, modifier et 
restituer F ensemble des trois points d'entree. 

On notera aussi qu'au retour d'une des veritables fonctions d'allocation, il nous faudra sauver 
a nouveau les trois points d'entree et reinstaller nos routines. En effet, une routine comme 
mallocO peut pointer a l'origine sur une fonction d' initialisation qui, apres son execution, 
modifiera son propre point d'entree pour acceder directement au code d'allocation durant les 
invocations ulterieures. Une routine peut done modifier son propre point d'entree ou celui des 
autres fonctions, et on sauvera de nouveau a chaque fois les trois pointeurs. Voyons done un 
exemple de fonctions d'encadrement. 

exemple_hook.c : 

#include <stdio.h> 
^include <stdlib.h> 
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#include <malloc.h> 



static 


void 


* pointeurjnalloc 


= NULL; 


static 


void 


* pointeur_realloc 


= NULL; 


static 


void 


* pointeur_free 


= NULL; 



static void * mon_malloc (size_t taille, void * appel); 
static void * mon_realloc (void * ancien, size_t taille, 

void appel ) ; 

static void mon_free (void * pointeur, void * appel); 



int 
main (void) 
{ 

char * bloc; 



/* Installation originale */ 
#ifndef NDEBUG 

pointeurjnalloc = mal 1 ocjiook; 

pointeur_realloc = real 1 oc_hook; 

pointeur_free = freejiook; 

malloc_hook = mon_malloc; 

realloc_hook = mon_realloc; 

free_hook = mon_free; 

#endif 

/* et maintenant quelques appels... */ 

bloc = malloc(128); 

bloc = realloc(bloc. 256); 

bloc = realloc(bloc, 16); 

f ree(bloc) ; 

bloc = calloc(256, 4); 

free(bloc) ; 

return EXIT_SUCCESS; 



static void * 
mon_malloc (size_t taille, void * appel) 
{ 

void * retour; 



/* restitution des pointeurs et appel de l'ancienne routine */ 

malloc_hook = pointeurjal 1 oc ; 

realloc_hook = pointeur_realloc; 

free_hook = pointeur_f ree; 

retour = mal 1 oc(tail 1 e) ; 

/* Ecriture d'un message sur stderr */ 

fprintf (stderr, "%p : mallocUu) -> %p \n", appel, taille, retour); 
/* on reinstalle nos routines */ 

pointeurjal loc = mallocjiook; 

pointeur_realloc = real 1 oc_hook; 

pointeur_free = freejiook; 
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mal 1 ocjiook = monjnalloc; 

realloc_hook = mon_realloc; 

free_hook = mon_free; 

return retour; 

} 



static void * 

mon_realloc (void * ancien, size_t taille, void * appel ) 
{ 

void * retour; 

/* restitution des pointeurs et appel de l'ancienne routine */ 

mal 1 oc_hook = pointeur_malloc; 

realloc_hook = pointeur_realloc; 

free_hook = pointeur_f ree; 

retour = realloc(ancien, taille); 

/* Ecriture d'un message sur stderr */ 

fprintf (stderr, "%p : reallocUp, %u) -> %p \n", 

appel, ancien, taille, retour); 
/* on reinstalle nos routines */ 

pointeurjnalloc = malloc_hook; 

pointeur_realloc = real 1 oc_hook; 

pointeur_f ree = free_hook; 

mallocjiook = monjnalloc; 

realloc_hook = mon_realloc; 

free_hook = mon_free; 

return retour; 



static void 
monjfree (void * pointeur, void * appel) 
{ 

/* restitution des pointeurs et appel de l'ancienne routine */ 

mallocjiook = pointeurjnalloc; 

realloc_hook = pointeur_real loc; 

free_hook = pointeur_f ree; 

f ree(pointeur) ; 

/* Ecriture d'un message sur stderr */ 

fprintf (stderr, "%p : freeUp)\n", appel, pointeur); 

/* on reinstalle nos routines */ 

pointeurjnalloc = mallocjiook; 

pointeurjnalloc = real 1 oOook; 

pointeur_f ree = freejiook; 

mallocjiook = monjnalloc; 

reallocjook = monjnalloc; 

freejiook = monjfree; 

} 

Le fait d'utiliser 1' argument void * appel dans les routines est en fait une astuce permettant 

de recuperer l'adresse de retour directement dans la pile. En fait, les variables mal 1 ocjiook, 

real 1 ocjiook et freejiook sont concues pour stocker des pointeurs sur des fonctions ne 

comportant pas ce dernier argument. II ne faut done pas s'etonner des avertissements fournis 
par le compilateur. On peut les ignorer sans danger. 
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On remarquera que l'encadrement par #ifndef NDEBUG #endif de l'initialisation de nos 
routines permet d'eliminer ce code de debogage lors de la compilation pour la version de 
distribution du logiciel. Voici a present un exemple d'execution : 

$ make 



cc -Wall 


-g 




exempl ejiook 


c -o exempl ejiook 




exempl e_ 


.hook 


c 


In 


function 


"main' : 




exempl e_ 


_hook 


c 


24: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


_hook 


c 


25: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


.hook 


c 


26: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


.hook 


c 


In 


function 


~mon_mal 1 oc ' : 




exempl e_ 


.hook 


c 


56: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


.hook 


c 


57: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


.hook 


c 


58: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


.hook 


c 


In 


function 


~mon_realloc' : 




exempl e_ 


.hook 


c 


79: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


.hook 


c 


80: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


.hook 


c 


81: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


.hook 


c 


In 


function 


~mon_free" : 




exempl e_ 


.hook 


c 


99: 


warning: 


assignment from incompatible pointer 


type 


exempl e_ 


.hook 


c 


100 


warning 


assignment from incompatible pointer type 


exempl e_ 


.hook 


c 


101 


warning 


assignment from incompatible pointer type 



$ . /exempl e_hook 

0x804859c : malloc(128) -> 0x8049948 

0x80485b2 : real 1 oc(0x8049948, 256) -> 0x8049948 

0x80485c5 : real 1 oc(0x8049948, 16) -> 0x8049948 

0x80485d6 : f ree(0x8049948) 

0x80485e5 : malloc(1024) -> 0x8049948 

0x80485f6 : f ree(0x8049948) 

$ 

Nous voyons bien tous nos appels aux trois routines de surveillance et aussi, que cal 1 oc( ) est 

construit en invoquant mall oc( ) , ce qui est rassurant car il n'existe pas de point d'entree 

calloc_hook. Les adresses fournies lors de l'invocation peuvent paraitre particulierement 
obscures, mais on peut aisement utiliser gdb pour retrouver la position de l'appel dans le 
programme. Recherchons par exemple ou se trouve le second real 1 oc( ) : 

$ gdb exempl e_hook 

GNU gdb 4.17.0.11 with Linux support 
[...] 

(gdb) list *0x80485c5 

0x80485c5 is in main (exemple_hook.c:32). 
27 #endif 



28 

29 /* et maintenant quelques appels... */ 

30 bloc = malloc(128); 

31 bloc = realloc(bloc, 256); 

32 bloc = realloc(bloc, 16); 

33 free(bloc); 

34 bloc = calloc(256, 4); 

35 free(bloc); 



Gestion de la memoire du processus 

Chapitre 13 



(gdb) quit 
$ 

En entrant list * suivi de l'adresse recherchee, gdb nous indique bien qu'il s'agit de la 
ligne 32 du fichier exemple_hook.c, dans la fonction main( ). 

Mais que d'energie deployee pour obtenir grosso modo le meme resultat qu'en invoquant 
mtraceO en debut de programme et en definissant la variable d'environnement MALL0C_ 
TRACE ! En fait, nous pouvons utiliser ces points d' entree dans les routines de gestion 
memoire pour effectuer des verifications d'integrite beaucoup plus poussees. On peut etre 
confronte a des debordements de buffer d'un seul octet, par exemple a cause d'une mauvaise 
borne superieure d'un intervalle, d'une utilisation de l'operateur <= au lieu de <, ou tout 
simplement en oubliant de compter le caractere nul a la fin d'une chaine. Ces bogues sont 
difficiles a detecter car, du fait de l'alignement des blocs sur des adresses multiples de 8 ou de 
16 octets suivant les architectures, le debordement d'un seul caractere peut parfaitement 
passer inapercu pendant longtemps. 

Nous allons considerer ici qu'un 1 ong i nt occupe 4 octets, ce qui est le cas sur les architectures 
x86, mais on peut reprendre le meme raisonnement en utilisant simplement sizeofClong 
int) pour rester portable. Nous pouvons encadrer toutes les zones de memoire allouees par 
deux blocs de 8 octets supplementaires. Le bloc inferieur contiendra la longueur de la 
memoire allouee (sur 4 octets) et une valeur constante sur les 4 octets suivants. Le bloc supe- 
rieur comprendra deux fois cette valeur constante. La zone de memoire renvoyee a 1' appelant 
sera comprise entre les deux blocs de surveillance. Imaginons que le programme demande 
une allocation de 256 octets, nous en avons en realite 256+16, soit 272 octets organises comme 
sur la figure 13.2. 



Figure 13.2 4 octets 4 octets 256 octets 4 octets 4 octets 
Encadrement - «-> >-> — —> 



256 


0x12345678 




0x12345678 


0x1 2345678 


Longueur 


Valeur 


Bloc de memoire 


Valeur 


Valeur 


du bloc 


magique 


reellement renvoye 


magique 


magique 



renvoye 



Lorsque nous allouerons un bloc, nous remplirons les donnees de surveillance correctement. 
Ensuite, quand nous recevrons un pointeur sur un bloc a redimensionner ou a liberer, nous 
verifierons que les donnees sont toujours en place. Si ce n'est pas le cas, le processus est 
arrete avec abortO. Avant de liberer un bloc, nous ecraserons toutes les donnees qu'il 
contient pour nous assurer qu'il n'est plus valide. Le programme exemple_hook_2.c va faire 
deborder une copie de chaine en oubliant volontairement le caractere nul. 

exemplejiook 2.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <malloc.h> 

static void * pointeurjnalloc = NULL; 
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static void * pointeur_realloc = NULL; 

static void * pointeur_f ree = NULL; 

static void * mon_malloc (size_t taille); 
static void * mon_realloc (void * ancien, size_t taille, 

void * appel ) ; 

static void mon_free (void * pointeur, void * appel); 
static int verifie_pointeur (void * pointeur); 

#define RESTITUTION_POINTEURS( ) _mal 1 oc_hook = pointeurjalloc; \ 

realloc_hook = pointeur_realloc; \ 

free_hook = pointeur_free; 

#define SAUVEGARDE_POINTEURS() pointeurjal 1 oc = _mal 1 oc_hook; \ 

pointeur_real loc = realloc_hook; \ 

pointeur_free = free_hook; 

#define INSTALLATI0N_ROUTINES( ) _mal 1 ocjiook = mon_malloc; \ 

realloc_hook = mon_realloc; \ 

freejiook = mon_free 

int 
main (void) 
{ 

char * bloc = NULL; 

char * chaine = "chaine a copier"; 

/* Installation originale */ 
#ifndef NDEBUG 

SAUVEGARDE_POINTEURS(); 

INSTALLATION_ROUTINES(); 
#endif 

/* Une copie avec oubli du caractere final */ 
bloc = mal 1 oc(strl en (chaine)); 
if (bloc != NULL) 

strcpy(bloc, chaine); 
free(bloc) ; 
return EXIT_SUCCESS; 



#define VALEUR_MAGIQUE 0xl2345678L 

static void * 
monjnalloc (size_t taille) 
{ 

void * bloc; 

RESTITUTION_POINTEURS(); 
bloc = malloc(taille + 4 * sizeof (long) ) ; 
SAUVEGARDE_POI NTEURS ( ) ; 
INSTALLATION_ROUTINES (); 
if (bloc == NULL) 
return NULL; 

/* et remplissage des donnees supplemental' res */ 
* (long *) bloc = taille; 
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* (long *) (bloc + sizeof (long) ) = VALEUR_MAGIQUE ; 

* (long *) (bloc + tai lie + 2 * sizeof (long) ) = VALEUR_MAGIQUE ; 

* (long *) (bloc + tai lie + 3 * sizeof (long) ) = VALEUR_MAGIQUE ; 
/* on renvoie un pointeur sur le bloc reserve a l'appelant */ 
return (bloc + 2 * sizeof (1 ong) ) ; 

} 

static void * 

mon_realloc (void * ancien, size_t taille, void * appel ) 

{ 

void * bloc; 

if (! verifie_pointeur(ancien) { 

fprintf (stderr, "%p : realloc avec mauvais bloc\n", appel); 
abortt ) ; 

} 

RESTITUTION_POINTEURS(); 
if (ancien != NULL) 

bloc = realloc(ancien - 2 * sizeof (long) , 
taille + 4 * sizeof (long) ) ; 

el se 

bloc = mal 1 octtai 1 1 e + 4 * sizeof (long) ) ; 
SAUVEGARDE_POINTEURS( ) ; 
INSTALLATION_ROUTINES (); 
if (bloc == NULL) 

return bloc; 

/* et rempl issage des donnees suppl ementai res */ 

* (long *) bloc = taille; 

* (long *) (bloc + sizeof (long) ) = VALEUR_MAGIQUE ; 

* (long *) (bloc + taille + 2 * sizeof (long) ) = VALEUR_MAGIQUE ; 

* (long *) (bloc + taille + 3 * sizeof (long) ) = VALEUR_MAGIQL)E ; 
/* on renvoie un pointeur sur le bloc reserve a l'appelant */ 
return (bloc + 2 * sizeof (1 ong) ) ; 



static void 
mon_free (void * pointeur, void * appel) 
{ 

long taille; 
long i ; 



if (! verifie_pointeur(pointeur)) { 

fprintf (stderr, "%p : free avec mauvais bloc\n", appel); 
abortt ) ; 

} 

if (pointeur == NULL) 

return; 
RESTITUTION_POINTEURS(); 
/* ecrabouillons les donnees ! */ 
taille = (* (long *) (pointeur - 2 * sizeof (1 ong) )) ; 
for (i = 0; i < taille + 4 * sizeof(long); i++) 

* (char *) (pointeur - 2 * sizeof (long) + i) =0; 
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/* et liberons le pointeur */ 

f reetpointeur - 2 * sizeof(long)) ; 

SAUVEGARDE_POINTEURS(); 

I NSTALLATION_ROUTINES (); 

} 

static int 
verifie_pointeur (void * pointeur) 
{ 

long taille; 

if (pointeur == NULL) 
return 1; 

if (* (long *) (pointeur - sizeof (long) ) != VALEUR_MAGIQUE) 
return 0; 

taille = * (long *) (pointeur - 2 * sizeof(long)) ; 
if (* (long *) (pointeur + taille) ! = VALEUR_MAGIQUE) 
return 0; 

if (* (long *) (pointeur + taille + sizeof(long)) != VALEUR_MAGIQUE) 

return 0; 
return 1; 

} 

Nous avons defini des macros pour remplacer les trois lignes de copie de pointeurs pour 
raccourcir et simplifier le fichier source. Voici un exemple d' execution avec detection du 
debordement de la chaine : 

$ ./exemple_hook_2 

0x804867b : free avec mauvais bloc 
Aborted (core dumped) 
$ rm core 
$ 

Bien entendu, ce genre de routine ne permet pas de detecter tous les defauts de gestion 
memoire dans un programme, mais on peut Fassocier avec les autres methodes, comme 
mtracet ) , pour verifier que l'application est aussi robuste qu'elle en a Fair exterieurement. 

Conclusion 

Ce chapitre a permis de mettre en place les principes fondamentaux de la gestion de la 
memoire d'un processus. II s'agit de notions elementaires et de routines presentes dans 
l'essentiel des applications courantes. Les methodes de debogage ou de parametrage presen- 
tees ici sont particulierement precieuses, mais elles ne sont malheureusement pas portables en 
dehors d'un environnement de programmation Gnu. Le prochain chapitre va nous permettre 
d'aborder des notions plus pointues sur la manipulation de Fespace memoire d'un processus. 

Les fonctions generates d' allocation memoire sont decrites dans [KERNIGHAN 1994] Le 
langage C. Pour obtenir des precisions sur les rapports entre les fonctions de bibliotheque 
comme mal 1 oc( ) et les appels-systeme comme brk( ) ou mmap( ), on consultera avec profit les 
sources de la bibliotheque GlibC. On notera egalement qu'une discussion concernant les 
risques induits par les allocations dynamiques et que des idees pour depister les bogues sont 
presentees dans [McCONNELL 1994] Programmation professionnelle. 
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Nous nous interesserons dans ce chapitre a divers aspects de la gestion memoire, plus 
complexes que les allocations et liberations etudiees dans le precedent chapitre. La plupart de 
ces fonctions ont ete introduites par la norme Posix.lb (avant d'etre integrees dans SUSv3) 
car elles concernent souvent les applications temps-reel. 

Nous etudierons tout d'abord le mecanisme du verrouillage de pages en memoire, qui inte- 
resse principalement les processus temps-reel et les applications de cryptographie. 

Nous verrons par la suite les possibilites offertes par le noyau Linux en ce qui concerne la 
projection de fichier dans une zone de l'espace memoire du processus. Nous pourrons alors 
comprendre le detail des techniques d' allocation de memoire dynamique au niveau du noyau. 

Enfin, nous observerons les protections d'une page memoire contre les acces indesirables. 

Verrouillage de pages en memoire 

La gestion de la memoire virtuelle sous Linux permet aux processus de disposer, dans leur 
ensemble, de beaucoup plus de memoire que la machine n'en contient physiquement. Nous 
en avons vu une illustration dans les premiers paragraphes du chapitre precedent, ou le 
programme exempl ejnal 1 oc_2 arrivait a disposer de 202 Mo sur une machine ne comportant 
que 128 Mo de memoire vive. 

Lorsque le noyau doit allouer une nouvelle page et qu'il n'en a plus de disponible en memoire 
vive, il recherche une page inutilisee depuis longtemps et la rejette de la memoire. Si cette 
page contient uniquement des donnees qui ont ete lues depuis un fichier, par exemple le code 
executable d'un programme, elle est purement et simplement effacee. On sait oil la retrouver. 
Si la page a ete modifiee par le processus auquel elle appartient, par contre le noyau la sauve- 
garde temporairement sur son peripherique de swap. 

Un processus est done en permanence susceptible de voir l'une de ses pages disparaitre tempo- 
rairement dans la memoire secondaire, pour etre rechargee lorsqu'il en demandera Faeces. 
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Ce mecanisme tres utile est transparent pour les processus, mais peut presenter neanmoins 
plusieurs inconvenients dans certains cas bien precis : 

• Au moment ou un processus tente d'acceder a une zone me moire qui a ete rejetee sur le 
peripherique de swap, le processeur declenche une faute de page. Le noyau recharge alors 
la page manquante et rend le controle au peripherique. Pour trouver suffisamment de place 
pour charger la page en question, le noyau peut etre oblige d'evacuer d'autres zones de 
donnees de la memoire, quitte a les sauvegarder a leur tour sur le disque. Tout cela ralentit 
considerablement Faeces a la zone memoire, et pire, le ralentissement n'est pas previsible. 
Or, sur des systemes de controle industriel par exemple, des processus sequences suivant 
un mecanisme temps-reel doivent pouvoir acceder a leur memoire dans un temps limite, 
pas necessairement de facon extremement rapide mais constante, quelles que soient les 
conditions de fonctionnement de la machine. 

• II peut arriver que des processus contiennent temporairement des donnees hautement 
confidentielles, comme des mots de passe ou des cles de cryptage. Si le noyau bascule sur 
le peripherique de swap la zone contenant ces donnees, elles s'y trouveront encore apres le 
rechargement de la page en memoire vive. II est alors possible de demonter le peripherique 
de swap assez rapidement et de 1' examiner octet par octet pour rechercher les informations 
secretes. 

Le noyau Linux offre une solution a ces problemes, ou plutot deux solutions differentes. Dans 
le premier cas, notre processus contient des zones critiques oil il ne peut pas se permettre le 
moindre delai imprevu. Aucune zone de memoire ne doit done etre projetee sur le swap. De 
plus, le processus doit disposer de suffisamment d'espace de pile libre pour les invocations 
des sous-routines. Rappelons que nous considerons uniquement les zones critiques de notre 
processus temps-reel, zones dans lesquelles on ne s'amusera pas a faire des allocations de 
nouvelles pages de memoire, par exemple. Nous devons done avoir l'assurance a 1' entree 
dans la portion critique qu' aucune partie du processus (donnees, code, pile) ne sera evacuee 
sur le peripherique de swap, et ceci jusqu'a la sortie de la section critique. 

Pour le second cas par contre, seules de petites parties de la memoire doivent rester absolu- 
ment en memoire physique. Le code, la pile et les autres donnees du processus peuvent tres 
bien etre ejectes temporairement ; nous voulons seulement nous assurer que nos donnees 
confidentielles ne seront pas stockees, meme passagerement sur le disque. Bien entendu, ce 
genre de processus doit utiliser l'appel-systeme setrl i mi t ( ) pour mettre a zero sa limite 
RLIMIT_CORE, comme nous l'avons vu dans le chapitre sur l'execution des processus, afin 
d'etre sur de ne pas laisser une image memoire sur le disque en cas de terminaison anormale. 

L'appel-systeme ml ock( ) permet de verrouiller une zone particuliere dans la memoire centrale. 
Les donnees qui s'y trouvent ne seront pas ejectees sur le swap avant que le processus ne 
se termine, qu'il effectue un exec( ) ou qu'il invoque l'un des appels-systeme munlockO et 
muni ockal 1 ( ). 

L'appel-systeme ml ockal 1 ( ) verrouille toute la memoire appartenant au processus, aussi bien 
son espace de code, de donnees, que sa pile, les bibliotheques partagees qu'il utilise ou les 
fichiers projetes que nous verrons a la prochaine section. 

L'appel muni ock( ) deverrouille uniquement une zone precise de memoire alors que muni ock- 
al 1 ( ) deverrouille toute la memoire du processus. 

Le verrouillage de page en memoire est une operation privilegiee car elle lese necessairement 
les autres processus qui disposeront de moins de memoire physique a se partager. Ces appels- 
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systeme sont done reserves aux processus s'executant avec l'UID effectif de root ou posse- 
dant la capacite CAP_IPC_LOCK. Notez que le nom de cette capacite evoluera peut-etre dans 
l'avenir car le prefixe IPC represente habituellement les communications entre processus et 
est surtout utilise avec le mecanisme IPC Systeme V que nous verrons dans le chapitre 25. 

II faut bien comprendre qu'il n'y a pas d'empilement des verrouillages. Autrement dit, une 
zone qui a ete verrouillee plusieurs fois, par exemple en intersection de plusieurs mlock( ) et 
avec un mlockallO, sera deverrouillee avec un seul appel munlockO. II ne faut done pas 
utiliser des verrouillages temporaires dans des routines sans etre conscient qu'on risque de 
deverrouiller des pages que la fonction appelante considerait comme fixees. 

Les prototypes des fonctions de verrouillage sont declares dans <sys/mman . h> ainsi : 

int mlock (const void * adresse_debut, size_t longueur) 
int munlock (const void * adresse_debut, size_t longueur); 
int ml ockal 1 (int type) ; 
int munlockall (void) ; 

Tous ces appels-systeme renvoient 0 s'ils reussissent et -1 en cas d'echec. 

On peut preciser en argument de ml ockal 1 ( ) ce qu'on desire verrouiller, en effectuant un OU 
binaire entre les constantes suivantes : 

MCL_CURRENT permet de verrouiller les zones memoire actuellement possedees par le processus. 

MCL_FUTURE sert a verrouiller les zones qui appartiendront au processus dans l'avenir. Ceci 
concerne bien entendu les nouvelles zones de memoire allouees dynamiquement, mais egale- 
ment la pile par exemple. 



Attention 

Lorsqu'on veut verrouiller I'ensemble des pages actuelles et celles qui seront allouees dans l'avenir, il faut 
utiliser MCL_CURRENT | MCL„FUTURE et non MCI__FUTURE seule. 



Avant d'entrer dans une section critique d'un processus temps-reel, nous devons allouer toutes 
les donnees necessaires, les verrouiller en memoire, et reserver assez de place dans la pile 
pour tous les appels de sous-routines durant cette portion critique. On utilisera un schema 
comme celui-ci : 

/* 

* Allocation de toutes les variables dynamiques necessaires 
*/ 

... mal 1 oc( . . . ) ... 

/* 

* Ecriture dans les variables dynamiques pour etre sur 

* qu'elles sont effectivement en memoire 
*/ 

. . . memsett . . . ) ... 
/* 

* Reservation de l'espace de pile, et verrouillage par 

* une fonction speciale. 
*/ 
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if (reserve_pile_et_verrouille() != 0) { 
perror( "mlockal 1 " ) ; 
exit(EXIT_FAILURE); 

} 

/* 

* Maintenant nous pouvons entrer dans la section critique 
*/ 



/* 

* Sortie de la portion critique du code 
*/ 

muni ockal 1 ( ) ; 

/* 

* Voici a present la routine reservant la place necessaire dans 

* la pile et verrouillant la memoire 
*/ 

#define TAILLE_RESERVEE 8192 

static int 
reserve_pi 1 e_et_verroui lie ( voi d) 
{ 

char * reserve; 

/* reservation dans la pile */ 
reserve = alloca(TAILLE_RESERVEE) ; 

/* ecriture pour s'assurer que les pages sont bien affectees */ 
memset(reserve, 0, TAILLE_RESERVEE) ; 

/* verrouillage de la memoire */ 
return ml ockal 1 (MCL_CURRENT) ; 

/* en revenant, la memoire occupee par la variable reserve est liberee 

* mais les pages restent en memoire physique a la disposition du 

* processus pour sa pile. 
*/ 

} 

Sous Linux, on ne peut verrouiller au maximum que la moitie de la memoire physique du 
systeme. Les appels-systeme mlockO et mlockallO peuvent done echouer si on essaye de 
depasser cette quantite (ou s'il n'y a plus assez de place en memoire a cause d'un autre 
processus ayant verrouille d'autres zones). Cela signifie aussi que lorsqu'on utilise MCL_ 
FUTURE avec ml ockal 1 ( ), des allocations memoire a venir pourront echouer a cause de cette 
limitation. 

Le noyau verrouillant des pages entieres de memoire, on risque des chevauchements entre des 
zones memoire proches. II est en effet possible de deverrouiller entierement une page alors 
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qu'elle contient des variables qu'on croit encore protegees. Dans le cas d'un processus desi- 
rant proteger des donnees bien precises mais pas tout son espace memoire, il est conseille de 
laisser toutes les donnees verrouillees jusqu'a ce qu'elles puissent toutes etre relachees sans 
risque. 

Le verrouillage d'une zone de memoire n'est pas herite au cours d'un fork( ). Les donnees 
restent verrouillees en memoire pour le pere, mais des que l'un des deux processus veut modi- 
fier le contenu d'une page memoire, le noyau en fait une copie a 1' intention du fils, et cette 
copie n'est pas verrouillee. On peut done dire qu'en cas de verrouillage complet avec mloc- 
kallO, le processus fils beneficiera probablement du maintien en memoire du code du 
programme jusqu'a la fin de son pere, mais ce n'est pas obligatoire. 

Les fonctions de verrouillage de pages en memoire sont definies par SUSv3. Pour assurer la 
portabilite d'un programme, on prendra en compte dans la compilation, par des tests condi- 
tionnels, les constantes symboliques : 

• _P0SIX_MEML0CK qui indique que ml ockal 1 ( ) et muni ockal 1 ( ) sont utilisables sur le 
systeme. 

• _POSIX_MEMLOCK_RANGE qui indique que ml ock( ) et muni ock( ) sont disponibles. 

Projection d'un fichier sur une zone memoire 

II est parfois interessant, plutot que de travailler directement sur le contenu d'un fichier, d'en 
projeter une image en memoire, sur laquelle on ceuvre ensuite comme avec des variables 
normales. Cette projection permet de manipuler le contenu du fichier au moyen d'une image 
en memoire, done beaucoup plus rapidement et simplement qu'avec de veritables lectures et 
ecritures sur le disque. 

Le noyau offre l'appel-systeme mmapO pour assurer la projection d'un fichier en memoire. 
Son prototype est declare dans <sys/mman . h> ainsi : 

void * mmap (void * debut, size_t longueur, 
int protection, int attribut, 
int fd, off_t decalage); 

Nous allons voir les arguments les uns apres les autres. Precisons tout de suite qu'en cas 
d'echec, mmap( ) renvoie la constante symbolique MAP_FAI LED, sinon il renvoie un pointeur sur 
la zone de memoire allouee pour la projection. Cette zone se trouve dans la portion de 
l'espace d'adressage nommee « tas ». Elle se situe au-dessus des donnees globales non initia- 
lisees, et en dessous de la pile. 

L argument debut indique 1' emplacement dans lequel on desire effectuer la projection. II ne 
s'agit que d'un simple desir, mmapO pouvant utiliser n'importe quelle autre adresse s'il le 
prefere. En general, on ne s'occupe pas de cet argument, on transmet NULL pour signifier a 
mmap( ) de prendre l'emplacement de son choix. Notons qu'on ne doit pas allouer de memoire 
pour la projection ; en fait la zone de projection ne doit meme pas avoir d' intersection avec un 
bloc memoire precedemment alloue. Si on desire absolument choisir un emplacement precis, 
il faut passer une adresse alignee sur une frontiere de page. La taille d'une page est disponible 
en interrogeant la fonction sysconf ( ) avec l'argument _SC_PAGESIZE. Nous ne developperons 
pas plus l'utilisation de l'argument debut car il est principalement utilise par les developpeurs 
du noyau pour le chargement des fichiers executables et des librairies partagees, sans interet 
immediat pour un programmeur applicatif. 
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Figure 14.1 

Projection d'unfichier 



Memoire 



en memoire 




decalage 



debut 



L' argument longueur indique, on s'en doute, la longueur de la projection en memoire. Cet 
argument sera arrondi par exces pour contenir un nombre entier de pages memoire. On peut 
indiquer plusieurs types de protection dans le troisieme argument, en utilisant un OU binaire 
entre les constantes suivantes : 

• PR0T_EXEC : le processus pourra executer le code contenu dans la projection ainsi realisee. 
Ceci est utilise par le noyau pour implementer l'appel-systeme execO avec les fichiers 
binaires executables. 

• PR0T_READ : les pages obtenues seront accessibles en lecture. 

• PROT_WRITE : on pourra ecrire dans la projection. Le noyau assurera la synchronisation 
avec le fichier disque dans des circonstances dont nous reparlerons plus bas. 

En fait, il existe egalement la protection vide PR0T_N0NE grace a laquelle on ne peut ni lire, ni 
ecrire, ni executer de code dans la memoire projetee. On peut l'utiliser de maniere tres speci- 
fique pour le debogage, comme nous le decrirons dans la section traitant des protections de 
zones memoire, mais c'est tres rare. 



Attention 

II faut remarquer que sur les architectures x86, le fait de demander PROTJIRITE entraine obligatoirement 
PR0T_READ, et qu'il n'y a pas de difference entre PR0T_READ et PR0T_EXEC. Ce n'est toutefois pas le cas 
sur d'autres processeurs, aussi positionnera-t-on bien les protections dont on a besoin. 



L' argument suivant, attri but, est compose d'un OU binaire entre les constantes symboliques 
suivantes : 

• MAP_PRIVATE : la projection n'est pas destinee a etre reecrite sur le disque, et la zone de 
memoire allouee ne doit pas etre partagee avec d'autres processus. Si le programme 
effectue une modification sur la zone de projection, une copie privee de cette portion de 
memoire lui sera attribute. 

• MAP_SHARED : au contraire de l'attribut precedent, les ecritures dans la zone de projection 
sont destinees a etre vues par le reste du monde. Dans le cas ou la zone de memoire est 
partagee, comme nous le verrons dans les communications entre processus, toute modifi- 
cation est immediatement perceptible dans les autres programmes. Par contre, la synchro- 
nisation effective avec le fichier disque n'est pas necessairement immediate. II faut etre 
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prudent si un processus concurrent tente d'acceder directement au fichier car il ne verra pas 
forcement les memes donnees que celles de la projection en memoire. 

• MAP_FIXED : permet de signaler a mmap( ) qu'on desire absolument disposer d'une projec- 
tion a l'adresse de depart indiquee en premier argument. Si ce n'est pas possible, l'appel- 
systeme echouera. 

Ces attributs sont les seuls qui sont definis par SUSv3, mais Linux propose egalement 
d'autres attributs specifiques, en voici quelques-uns : 

• MAP_AN0N ou MAP_AN0NYM0US : on ne projette pas reellement un fichier, mais on desire 
obtenir une zone memoire vierge, emplie de zeros. La bibliotheque GlibC l'utilise pour 
implementer mallocO. Lorsque cet attribut est mentionne, les deux derniers arguments fd 
et decalage de l'appel-systeme sont ignores. Sur les systemes ou MAP_AN0NYM0US n'existe 
pas, on peut se servir des pseudo-fichiers /dev/nul 1 ou /dev/zero pour allouer une zone de 
memoire vierge. 

• MAP_DENYWRITE : empeche l'ecriture dans le fichier correspondant tant que la projection en 
memoire est valide. C'est ce qu'utilise l'appel-systeme exec( ) pour verrouiller le fichier 
executable correspondant au processus lance. Cela permet au noyau de supprimer des 
pages de code pour liberer de la memoire tout en etant sur de pouvoir les relire par la suite. 
C'est aussi ce qui declenche une erreur ETXTBSY de l'editeur de liens lorsqu'on relance une 
compilation sans avoir arrete le processus resultant. Malheureusement, cet attribut est 
silencieusement ignore durant les appels-systeme, seul le noyau a la possibility de l'utiliser. 

• MAP_GR0WSD0WN : indique qu'on utilise une projection anonyme pour allouer une zone de 
memoire qui grossira par le bas. Cet attribut sert au noyau pour mettre en place la pile d'un 
processus. 

Lors d'un appel a mmapO, il faut utiliser l'une des deux constantes MAP_PRIVATE ou MAP_ 
SHARED, meme si elles n'ont de sens que lorsqu'on ecrit dans la zone de projection. Toutes les 
autres sont facultatives. 

On comprend mieux a present comment mmap( ) est utilise par mal 1 oc( ) pour reserver de gros 
blocs en memoire, et pourquoi la memoire allouee avec cal 1 oc( ) contient des zeros sans qu'il 
y ait eu de veritable ecriture pour F initialiser : lorsque nous demandons une projection 
PRIVATE et ANONYMOUS, le noyau nous fournit des pages virtuelles, sans correspondance reelle 
avec la memoire physique du systeme. Quand nous essayons de lire le contenu de ces zones, 
une faute de page est declenchee et le noyau, s'apercevant qu'il s'agit d'une projection 
anonyme (ou du pseudo-fichier /dev/zero), sait qu'il doit nous renvoyer des zeros. Par contre, 
des que nous tentons d'ecrire sur cette projection, la faute de page qui se declenche oblige le 
noyau a affecter une veritable zone de memoire physique au processus, a copier le contenu de 
la projection (en l'occurrence il suffit de remplir la nouvelle page avec des zeros), puis a auto- 
riser l'ecriture par le programme. Ce n'est done qu'au moment de l'ecriture dans la memoire 
allouee avec mmapC ) que le stock de pages physiquement disponibles diminue. 

L argument fd correspond a un descripteur de fichier deja ouvert par le processus. Bien 
entendu le mode d'ouverture devra correspondre, en ce qui concerne les possibilites d'ecri- 
ture dans le fichier, aux protections de la zone memoire. Dans tous les cas, le fichier devra 
permettre la lecture, autrement dit il faudra l'ouvrir en mode 0_RDONLY ou 0_RDWR (nous 
verrons la signification de ces modes dans le chapitre consacre a la gestion des fichiers). 

Le dernier argument, decalage, correspond a la position dans le fichier de la projection. 
On n'est pas oblige en effet de projeter tout le fichier, pas plus d'ailleurs que le debut. 
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Le decalage est mesure en nombre d' octets, comme la valeur qu'on transmet a un appel- 
systeme 1 seek( ). 

Lorsque mmap( ) echoue, la variable globale errno est mise ajour et contient un code indiquant 
l'erreur qui s'est produite. Certaines erreurs ne sont pas vraiment intuitives, aussi nous allons 
les detailler rapidement : 



Erreur Problemes 

EACCES Le fichier ne nous permet pas la lecture. 

Le fichier ne nous permet pas I'ecriture, et on a reclame un acces a la fois en PROT_WRITE sur la zone et 
un partage MAP_SHARED. Dans le cas d'une projection privee MAP_PRIVATE, ce n'est pas un probleme, 
le fichier ne sera pas mis a jour en cas de modification de la zone de memoire puisqu'on travaille sur une 
copie. En projection partagee, il faut pouvoir inscrire sur le disque les modifications pour les rendre 
visibles a I'exterieur. 

De meme, en projection partagee, un fichier ne doit pas etre ouvert en mode d'ajout uniquement en fin 
de fichier. 

EAGAIN Le processus a demande un verrouillage en memoire de ses allocations a venir avec I'argument MCL_ 
FUTURE de I'appel ml ockal 1 ( ). Allouer la taille demandee depasserait sa limite de memoire verrouillee 
RLIMIT_MEMLOCK, accessible avec getrl imitO. 

Un verrouillage strict a ete place par le processus avec fcntl ( ) sur le fichier, et on demande une 
projection partagee avec MAP_SHARED. 

EINVAL On a demande une projection a une adresse invalide ou de longueur beaucoup trap grande. 

L'adresse mentionnee n'est pas alignee sur une frontiere de page alors qu'on a demande une projection 
figeeavec MAP_FIXED. 

On n'a utilise ni I'attribut MAP_SHARED ni MAP_PRIVATE, ou au contraire on les a mentionnes tous les 
deux. 

On a demande une projection ANONYMOUS avec un attribut MAP_SHARED. C'est impossible car la projection 
anonyme necessite de faire une copie des une tentative d'ecriture dans les pages virtuelles vierges. 
Attention, sur certains systemes ce type de projection est autorisee et permet de creer de la memoire 
partagee entre un processus pere et son fils. Sous Linux, ce n'est pas le cas.Toutefois on peut utiliser un 
fichier temporaire de la dimension voulue pour partager un bloc memoire facilement, comme nous le 
ferons dans notre second exemple. 

ENODEV Le fichier mentionne ne permet pas la projection en memoire. Ceci concerne surtout des fichiers 
speciaux representant des peripheriques comme /dev/tty par exemple. 

ENOMEM II y a trap de projections en memoire. La limite MAX_MAP_COUNT du nombre de projections simultanees 
sur le systeme est definie dans <1 inux/sched. h>. Elle vaut 65536 sur les architectures x86. 
On ne peut pas obtenir une zone de memoire de la taille demandee. Ceci peut aussi correspondre a un 
manque de memoire du noyau le rendant incapable de mettre a jour ses structures internes. 



L'erreur ETXTBSY devrait normalement etre renvoyee si on demande la projection en memoire 
avec I'attribut MAP_DENYWRITE d'un fichier deja ouvert en ecriture par plusieurs processus. 
Toutefois, cet attribut est silencieusement efface par le noyau Linux lors de l'appel-systeme. 

Une fois que mmap( ) a reussi, il est possible de refermer le fichier, la projection en memoire 
persisterajusqu'a ce qu'on la libere avec munmap( ). Les zones projetees sont automatiquement 
liberees lors de la fin d'un processus ou d'un appel exec( ). Par contre, les projections sont 
heritees au cours d'un fork( ), nous en verrons un exemple plus loin. Les projections PRIVATE 
sont copiees au moment de la premiere tentative d'ecriture dans la zone, aussi il n'y a aucune 
ambiguite entre les processus pere et fils. 
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L'appel-systeme munmap( ) a le prototype suivant : 

int munmap (void * zone, size_t longueur); 

II libere la projection se trouvant dans la zone indiquee, avec la longueur passee en second 
argument. La seule maniere raisonnable d'utiliser munmap ( ) est de lui transmettre le pointeur 
fourni par un appel anterieur a mmapO, ainsi que la meme longueur que celle qu'on avait 
passee a mmap( ). Lorsqu'ilreussit, munmap( ) renvoie 0. La zone de memoire est alors liberee et 
rendue inutilisable. 

On invoque rarement munmapO, car la plupart du temps les projections qu'on etablit en 
memoire sont utilisees pendant toute la duree de vie du processus, et on laisse le systeme les 
liberer automatiquement a la terminaison du programme. 

II est possible de faire une projection d'un fichier complet, dont la taille depasse largement 
celle de la memoire totale - physique et swap - du systeme. En effet, le noyau liberera des 
pages memoire au fur et a mesure, en les reecrivant sur le disque si elles ont ete modifiees, ou 
en les effacant purement et simplement si elles sont intactes. La limitation theorique est celle 
de Fespace d'adressage disponible, c'est-a-dire sur architecture x86 4 Go moins 1 Go reserve 
au noyau, moins le code du processus, sa pile et ses donnees, ce qui nous laisse quand meme 
normalement plus de 2 Go. Attention, ceci n'est vrai que si le noyau peut eliminer de la 
memoire les pages qui l'encombrent, autrement dit le calcul est totalement different si on 
utilise une projection PRIVATE et si on modifie les donnees projetees. Dans ce cas, la limite de 
projection est de Fordre de la taille de la memoire virtuelle disponible. 

Notre premier exemple va consister a ecrire un programme qui retourne completement un 
fichier, en echangeant successivement le premier octet et le dernier, le deuxieme et l'avant- 
dernier, et ainsi de suite. L'interet d'un tel utilitaire reste encore a demontrer, mais on pourrait 
tres bien le transformer pour effectuer du traitement d' image, par exemple. 

Nous utiliserons la fonction statu - que nous etudierons ulterieurement en detail - pour 
connaitre la taille du fichier, puis nous le projetterons en memoire et nous le retournerons 
simplement en le considerant comme un tableau de caracteres. Ceci aurait ete particuliere- 
ment fastidieux a ecrire avec des appels-systeme read( ) et write( ), alors que l'implementa- 
tion se fait, avec mmap( ), de maniere tres intuitive. 

exemple_mmap_1.c : 

#include <fcntl .h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <sys/stat.h> 

#include <sys/mman.h> 

int 

main (int argc, char * argv[]) 
{ 

char * projection; 

int fichier; 

struct stat etat_fichier; 

long taille_fichier; 

int i ; 

char tmp; 
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if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s fichier_a_inverser\n" , argv[0]); 
exit(EXIT_FAILURE); 

} 

if ((fichier = open(argv[l] , 0_RDWR)) < 0) { 
perror( "open" ) ; 
exit(EXIT_FAILURE); 

} 

if (stat(argv[l], & etat_fichier) != 0) { 
perror( "stat" ) ; 
exit(EXIT_FAILURE); 

} 

tail 1 e_f i chi er = etat_fichier.st_size; 
projection = (char *) mmap(NllLL, taille_fichier, 

PR0T_READ | PR0T_WRITE, MAP_SHARED, fichier, 0); 
if (projection == (char *) MAP_FAI LED) { 

perror( "mmap" ) ; 

exit(EXIT_FAILURE); 

} 

close(fichier) ; 

for (i = 0; i < taille_fichier / 2; i ++) { 
tmp = project! on[i] ; 

projection[i ] = projection[taille_fichier - i - 1]; 
projection[taille_fichier - i - 1] = tmp; 

} 

munmapt (void *) projection, tai 1 1 e_f ichier) ; 
return EXIT_SUCCESS ; 

} 

Nous l'utilisons pour retourner un petit fichier de texte : 
$ cat > test.txt 

AZERTYUIOP 
QSDFGHJKLM 
WXCVBN 

(Controle-D) 
$ ./exemple_mmap_l test.txt 
$ cat test.txt 



NBVCXW 

MLKJHGFDSQ 

POIUYTREZA 

$ ./exemple_mmap_l test.txt 
$ cat test.txt 

AZERTYUIOP 
QSDFGHJKLM 
WXCVBN 



$ 
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A present, nous allons verifier que, comme nous l'annoncions plus tot, il est possible de 
projeter en memoire un fichier plus gros que l'ensemble de la memoire virtuelle si on utilise 
bien une projection SHARED, ce qui est le cas dans notre exemple. Pour cela, nous avons besoin 
d'un gros fichier de test. Nous allons done ecrire un petit programme creant un fichier conte- 
nant le nombre de mega-octets qu'on demande en ligne de commande. Chaque bloc d'un 
mega-octet sera rempli avec une valeur differente pour verifier que le retournement se passe 
bien. 

cree_gros_fichier.c : 

#include <stdio.h> 
finclude <stdlib.h> 

#define TAI LLE_BL0C (1024 * 1024) 

int 

main (int argc, char * argv[]) 
{ 

int nombre_blocs; 
FILE * fp; 
char * bloc; 
int i; 

if ((argc != 3) || (sscanf (argv[2] , "M", & nombre_blocs) != 1) ) { 
fprintf (stderr, "Syntaxe : %s fichier nb_blocs \n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

if ((fp = fopen(argv[l], "w")) == NULL) { 
perror( "fopen" ) ; 
exi t(EXIT_FAI LURE); 

} 

if ((bloc = malloc(TAILLE_BLOO) == NULL) { 
perror( "mal 1 oc" ) ; 
exi t(EXIT_FAI LURE); 

} 

for (i = 0 ; i < nombre_bl ocs ; i ++) { 
memset(bloc, i, TAILLEJ3L0C) ; 

if (fwrite(bloc. 1, TAI LLE_BL0C , fp) ! = TAI LLE_BL0C) { 
perrorC'fwrite") ; 
exi t(EXIT_ FAILURE); 

} 

} 

f cl ose(fp) ; 

return EXIT_SUCCESS; 

} 

Pour observer le contenu du fichier, on utilisera le petit utilitaire exempl e_getcha r . c que nous 
avions developpe dans le chapitre 10. Bien entendu, nous ne presenterons ici que des extraits 
de son affichage. 

La memoire totale de notre systeme fait 256 Mo, e'est done la valeur que nous choisirons 
pour notre gros fichier (et qui nous evite un retour a zero des caracteres de remplissage apres 
avoir depasse 255). 
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Ces programmes sont assez gourmands en ressources systeme, il vaut done mieux eviter de 
les faire fonctionner sur une machine ayant plusieurs utilisateurs, ou alors il faut les lancer 
avec la commande ni ce. 

$ ./cree_gros_fichier test. bin 256 
$ Is -1 test. bin 

-rw-r--r— 1 ccb ccb 268435456 Oct 10 18:28 test. bin 
$ . ./10/exemple_getchar < test. bin 

00000000 
00000010 

[...] 

000FFFE0 
000FFFF0 
00100000 
00100010 

[...] 
001FFFE0 
001FFFF0 
00200000 
00200010 
[...] 
[...] 
0FFFFFC0 
OFFFFFDO 
OFFFFFEO 
OFFFFFFO 

$ ./exemple_mmap_l test. bin 
$ . . /10/exemple_getchar < test. bin 

00000000 
00000010 

[...] 

000FFFE0 
000FFFF0 
00100000 
00100010 
[...] 
[..J 
OFEFFFEO 
OFEFFFFO 
0FF00000 
0FF00010 

[...] 
OFFFFFEO 
OFFFFFFO 
$ rm test.* 
$ 

Bien sur, la verification du fonctionnement de notre programme est un peu sommaire car le 
contenu de chaque bloc d'un mega-octet est constant, mais nous avons bien manipule, direc- 
tement dans notre espace d'adressage, un fichier dont la taille depasse largement la memoire 
que le systeme nous offre. L'interet de ce genre de projection apparait plus clairement dans 
les domaines du traitement d'images ou des echantillons de son numerique, qu'on manipule 
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ainsi comme des blocs de memoire meme si le fichier sous-jacent depasse, de loin, la memoire 
virtuelle du systeme. 

Notre second exemple d'utilisation de tnmapO va consister a utiliser la projection partagee 
d'un fichier temporaire pour disposer d'une variable partagee entre un processus et son fils. 
Nous desirons obtenir une zone memoire de la taille (au moins) d'un entier. Nous allons 
demander au systeme de nous donner le nom d'un fichier temporaire, puis nous allons le creer 
et y ecrire une variable de la taille desiree. Ensuite, nous projetterons ce fichier en memoire, 
et nous utiliserons l'adresse resultante comme pointeur sur une variable entiere. 

Les deux processus peuvent alors se separer. Rappelons que les projections en memoire sont 
heritees lors d'un forkO. Le processus pere va incrementer cette variable de 0 a 9, en 
envoyant apres chaque mise a jour un signal SIGUSR1 a son fils, et en dormant pendant une 
seconde (methode sale mais simple pour attendre que le fils ait affiche son resultat). Le 
processus fils ne fait qu' ecrire a l'ecran le contenu de la variable entiere au sein de son 
gestionnaire de signaux. 

exemple_mmap_2.c : 

#include <fcntl .h> 

#include <signal .h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <sys/stat.h> 

#include <sys/mman.h> 

int * entier; 

void 

gestionnai re_sigusrl (int num) 
{ 

fprintf (stdout, "Fils : * entier = %d\n" , * entier); 
f f 1 ush(stdout) ; 

} 

int 
main (void) 

{ 

char * nom_fichier; 
int fichier; 
pid_t pid; 

if (signal (SIGUSR1, gestionnaire_sigusrl) == SIG_ERR) ( 
perrorC'signal ") ; 
exi t( EXIT_FAI LURE) ; 

} 

if ((nom_fichier = tmpnam(NULL) ) == NULL) { 
perror( "tmpnam" ) ; 
exi t(EXIT_FAI LURE); 

} 

if ((fichier = open(nom_fichier, 0_RDWR | 0_CREAT | 0_TRUNC, 
S_IRUSR | S_IWUSR)) < 0) { 
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perror( "open" ) ; 
exit(EXIT_FAILURE); 

} 

if (write(fichier, & fichier, sizeof(int)) != sizeof(int)) { 
perror( "write" ) ; 
exit(EXIT_FAILURE); 

} 

entier = (int *) mmap(NULL, sizeof(int), 

PR0T_READ | PROT_WRITE, MAP_SHARED, 
fichier, 0); 
if (entier == (int *) MAP_FAI LED) { 
perror( "mmap" ) ; 
exit(EXIT_FAILURE); 

} 

cl ose(fi chier) ; 

unl ink(nom_fichier) ; 

if ( (pid = forkO) < 0) { 
perror( "fork" ) ; 
exit(EXIT_FAILURE); 

} 

if (pid == 0) { 
while (1) 
sleep(l) ; 

} else { 

for ((* entier) = 0; (* entier) < 10; (* entier) ++) { 
fprintf (stdout, "Pere : * entier = %d\n" , * entier); 
ff 1 ush(stdout) ; 
ki 11 (pid . SIGUSR1); 
sleep(l) ; 

} 

/* Ne pas oublier de tuer le fils qui est en attente */ 
kilKpid, SIGKILL); 

} 

return EXIT_SUCCESS; 



} 



On notera qu'on detruit avec unlink() le fichier temporaire apres F avoir referme. Le noyau 
ne l'effacera toutefois completement que lorsque sa derniere reference sera refermee, en 
l'occurrence lorsque la fin des processus liberera la zone de projection en memoire. 

0 
0 
1 
1 
2 
2 
3 
3 
4 
4 
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* 
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$ 

Nous voyons ainsi une methode assez simple et amusante de partager de la memoire entre 
deux processus pere et fils. Bien entendu, nous observerons une autre technique, plus conven- 
tionnelle, dans le chapitre consacre aux communications entre processus. 

Dans notre dernier exemple, nous ne nous sommes pas soucie du contenu effectif du fichier 
projete. La seule chose qui nous interessait etait que la zone memoire de la projection soit 
partagee avec le processus fils. Parfois au contraire, les modifications apportees au fichier 
doivent etre visibles de l'exterieur, que ce soit pour la lecture directe du fichier ou pour 
d'autres programmes qui en effectuent une projection dans leur propre memoire. 

Ce n'est, par defaut, que lorsqu'une projection SHARED est supprimee avec munmap( ) ou a la fin 
du processus, que le noyau nous garantit que les modifications apportees a la zone de projec- 
tion seront repercutees sur le fichier. Si nous desirons nous en assurer a un autre moment, 
l'appel-systeme msync( ) fournit plusieurs possibilites. Son prototype est le suivant : 

int msync (const void * debut, size_t longueur, int attribut); 

Lorsqu'on invoque msync ( ), on lui transmet le pointeur sur la zone de projection qu'on desire 
mettre a jour, ainsi que la longueur de la zone. Naturellement, il est conseille de ne demander 
que la mise a jour des portions effectivement modifiees de la projection, et pas necessaire- 
ment tout le fichier. L' attribut fourni en troisieme argument peut contenir les constantes 
symboliques suivantes, liees par un OU binaire : 

MS_ASYNC : cette option demande au noyau de se preparer a mettre a jour les zones indiquees. 
Neanmoins, l'ecriture n'a pas lieu tout de suite, l'appel-systeme revenant immediatement. 

MS_SYNC : avec cet attribut, le noyau effectue tout de suite la mise a jour. Lorsque l'appel- 
systeme revient, nous savons qu'une lecture directe du fichier concerne nous renverrait les 
informations mises a jour. Toutefois, rien ne nous assure que les donnees aient ete reellement 
ecrites sur le disque, celui-ci peut gerer un cache plus ou moins important et retarder les ecri- 
tures effectives. 

MS_INVALIDATE : qu'on utilise une mise a jour synchrone ou asynchrone, le noyau nous assure 
uniquement qu'une lecture directe du fichier renverra nos donnees mises a jour. Malgre tout, 
d'autres processus, totalement independants du notre, peuvent avoir effectue une projection 
du meme fichier dans leur espace memoire. Cet attribut garantit que leurs pages seront invali- 
dees et que le noyau les reprendra sur le disque lors du prochain acces aux donnees. 

On ne doit evidemment pas utiliser les options MS_ASYNC et MS_SYNC simultanement. 

II existe egalement sous Linux un appel-systeme supplementaire. II n'est disponible qu'en 
utilisant l'option _GNU_SOURCE lors de la compilation. II s'agit de mremapO, qui permet a la 
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maniere de reallocO d'agrandir ou de retrecir une zone de projection en memoire. Son 
prototype est le suivant : 

void * mremap (void * zone, size_t ancienne_longueur, 
size_t nouvelle_longueur, int attribut); 

On transmet en argument un pointeur sur la zone de projection en cours, ainsi que sa lon- 
gueur, suivi de la nouvelle longueur desiree. L' attribut peut eventuellement prendre comme 
unique valeur celle de la constante symbolique MREMAP_MAYMOVE, auquel cas mremap () sera 
autorise a deplacer la zone de projection dans Fespace d'adressage. L'appel-systeme renvoie 
un pointeur sur la nouvelle zone, ou MAP_FAI LED en cas d'echec. Bien entendu, les relations 
avec le fichier sous-jacent sont conservees. Si on agrandit une zone de projection, il est possi- 
ble d'acceder a une plus grande partie du fichier. 

Avant de conclure ce chapitre sur la gestion de la memoire, nous allons nous interesser au 
principe de la protection des pages memoire, sujet que nous avons effleure sans entrer dans 
les details en presentant le troisieme argument d'invocation de mmap( ). 

Protection de I'acces a la memoire 

L'appel-systeme mprotectO permet de limiter les possibilites d'acces a certaines pages 
memoire. Son prototype est le suivant : 

int mprotect (const void * debut_zone, size_t longueur, int protection); 

La zone de memoire a proteger doit etre alignee sur une frontiere de page. Nous detaillerons 
tout ceci plus bas. 

La protection qu'on reclame en troisieme argument est du meme genre que celle de l'appel 
mmap( ), avec une composition par OU binaire des constantes suivantes : 



Constante 


Signification 


PR0T_N0NE 


Aucune autorisation d'acces 


PR0T_READ 


Autorisation de lire dans la zone 


PROT_WRITE 


Autorisation d'ecrire dans la zone memoire 


PR0T_EXEC 


Possibility d'y executer du code 



Lorsque l'appel mprotectO reussit, il renvoie 0 et remplace completement les protections 
originales de la zone memoire, sinon il renvoie -1 . 

L autorisation PR0T_EXEC ne concerne normalement pas le programmeur applicatif. De toute 
maniere, sur les architectures x86 par exemple, PR0T_EXEC et PR0T_READ ont exactement le 
meme effet. Peut-etre y aura-t-il malgre tout une evolution future. Aussi on utilise correcte- 
ment ces attributs pour assurer la perennite et la portability d'un programme. II est dommage 
que PR0T_EXEC ne soit pas reellement utilise par la gestion memoire des processeurs x86, car 
cela permettrait de dejouer une partie des attaques de securite en empechant formellement 
d' executer des instructions en dehors du segment de code initialise au chargement du 
programme. Nous avons deja vu que de nombreux piratages se basaient sur le debordement 
de chaines de caracteres locales pour placer des instructions personnelles dans la pile des 
utilitaires systeme Set-UID. 
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Le fait d'interdire tout acces avec l'autorisation vierge PR0T_N0NE peut servir au debogage 
d'un programme pour controler tous les acces d'une application a une zone de memoire 
allouee dynamiquement. Par exemple, on peut placer l'autorisation PR0T_N0NE des l'alloca- 
tion, et ne permettre la lecture qu'a partir du moment ou 1' initialisation a lieu. Si un autre 
module tente d'utiliser la variable avant la fin de 1' initialisation, le processus sera tue par un 
signal, et nous pourrons employer gdb et le fichier core pour remonter jusqu'a l'utilisation 
fautive. 

Sur les processeurs x86, le fait de demander une autorisation d'ecriture PROT_WRITE entraine 
egalement la disponibilite en lecture (et done en execution), mais cela n'est pas necessaire- 
ment portable sur les autres architectures. 

Nous avons precise que Fadresse de debut de zone doit etre alignee sur une frontiere de page. 
C'est automatiquement le cas avec les zones memoire allouees par mmap( ) ; aussi est-ce la 
maniere la plus simple d'allouer les zones qu'on protegera ulterieurement. La fonction 
mall oc( ) utilise en interne l'appel-systeme mmap( ) dans certaines conditions, mais on ne peut 
pas en etre certain. S'il y a suffisamment de place libre dans le segment de donnees qui n'a 
pas ete rendu au systeme, elle est employee avant toute chose. 

Pour assurer la portabilite de notre application, on se conformera done au standard SUSv3 en 
allouant les zones memoire avec mmapO en projection ANONYMOUS. II faudra simplement se 
mefier de la difference entre mal 1 oc( ) , qui renvoie NULL en cas d'echec, et mmap( ) , qui renvoie 
MAP_FAI LED (qui vaut normalement -1). Pour eviter toute ambiguite, on pourra se redefinir une 
fonction d' allocation semblable a mal 1 oc( ). La seule contrainte est de conserver la taille de la 
zone allouee car on doit la transmettre a mprotect( ). 

Lorsqu'un processus tente d'acceder de maniere illegale a une zone de memoire protegee, il 
est tue par le signal SIGSEGV. En voici une illustration : 

exemple_mprotect_1.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <sys/mman.h> 

#define TAILLE_CHAINE 128 

void * 

mon_mal 1 oc_avec_mmap (size_t taille) 
{ 

void * retour; 

retour = mmaptNULL, taille, PR0T_READ | PROT_WRITE, 
MAP_PRIVATE | MAP_AN0NYM0US, 0, 0); 
if (retour == MAP_FAI LED ) 

return NULL; 
return retour; 

} 

int 
main (void) 

{ 

char * chaine = NULL; 



384 



Programmation systeme en C sous Linux 



fprintf(stdout, "Allocation de %d octets \n", TAILLE_CHAINE) ; 
chaine = mon_malloc_avec_mmap(TAILLE_CHAINE); 
if (chaine == NULL) { 

perror( "mmap" ) ; 

exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Protections par defaut \n"); 

fprintf (stdout, " Ecriture ..."); 

strcpy(chaine, "Ok"); 

fprintf (stdout, "Ok\n"); 

fprintf (stdout, " Lecture ..."); 

fprintf (stdout, "£s\n", chaine); 

fprintf (stdout, "Interdiction d'ecriture \n"); 

if (mprotecttchaine, TAILLE_CHAINE, PR0T_READ) < 0) { 

perror( "mprotect" ) ; 

exit(EXIT_FAILURE); 

} 

fprintf (stdout, " Lecture ..."); 
fprintf (stdout, "£s\n", chaine); 
fprintf (stdout, " Ecriture ..."); 
strcpy(chaine, "Non"); 

/* ici on doit deja etre arrete par un signal */ 
return EXIT_SUCCESS; 

} 

Nous executons le programme, puis nous invoquons gdb pour rechercher d'ou vient l'erreur : 

$ ./exemple_mprotect_l 

Allocation de 128 octets 
Protections par defaut 

Ecriture ...Ok 

Lecture ...Ok 
Interdiction d'ecriture 

Lecture ...Ok 
Segmentation fault (core dumped) 
$ gdb exemple_mprotect_l core 
GNU gdb 4.17.0.11 with Linux support 
[...] 

Core was generated by " . /exemple_mprotect_l ' . 

Program terminated with signal 11, Erreur de segmentation. 

Reading symbols from /lib/libc.so.6. . .done. 

Reading symbols from /lib/ld-linux.so.2. . .done. 

#0 strcpy (dest=0x40015000 <Address 0x40015000 out of bounds>. 

src=0x8048782 "Non") at . ./sysdeps/generic/strcpy .c:38 
. ./sysdeps/generic/strcpy.c:38: Aucun fichier ou repertoire de ce type, 
(gdb) bt 

#0 strcpy (dest=0x40015000 <Address 0x40015000 out of bounds>. 

src=0x8048782 "Non") at . ./sysdeps/generic/strcpy .c:38 
#1 0x8048692 in main () at exemple_mprotect_l.c:47 
#2 0x40030cb3 in 1 ibc_start_main (main=0x804853c <main>, argc=l. 

argv=0xbffffdl4, init=0x8048378 <_init>, fini=0x80486dc <_f i ni > , 

rtld_fini=0x4000a350 <_dl_fini>, stack_end=0xbffffd0c) 
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at . ./sysdeps/generic/libc-start.c:78 
(gdb) quit 
$ rm core 
$ 

Le processus est bien tue par un signal SIGSEGV, avec creation d'une image disque core. 
L'invocation de gdb nous apprend que l'erreur s'est produite dans la routine strcpy ( ), dont le 
fichier source etait « . ./sysdeps/generic/strcpy.c » lors de la compilation de la biblio- 
theque C. Cela ne nous est pas d'un grand secours, aussi utilisons-nous la commande bt (pour 
backtrace, suivi en arriere) qui nous permet de voir que strcpy ( ) a ete invoquee en ligne 47 
du fichier exempl e_mprotect_l . c. 

Nous observons que la ligne « Ecriture. . . » n'a pas ete transmise sur stdout, car le buffer n'a 
pas ete vide par ff 1 ush() ni par un retour a la ligne avant l'arret brutal du programme. 

Le comportement du processeur face a un acces illegal a la memoire peut paraitre deroutant 
de prime abord. En effet, lorsqu'une faute d' acces est detectee, le noyau est prevenu. II envoie 
alors un signal au processus. Par contre, le compteur d' instruction du programme n'est pas 
incremente. Cela signifie que si le processus n'est pas tue par le signal, au retour du gestion- 
naire de SIGSEGV, il retentera la meme operation d' acces interdite. En voici une demonstration. 

exemple_mprotect_2.c : 

#include <signal .h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <sys/mman.h> 

#define TAILLE_CHAINE 128 

void 

gestionnai re_sigsegv (int numero) 

{ 

fprintf (stderr, "Signal SIGSEGV recu \n"); 

} 



int 
main (void) 

{ 

char * chaine = NULL; 

if (signal (SIGSEGV, gestionnaire_sigsegv) == SIG_ERR) { 
perrorC'signal ") ; 
exit(EXIT_FAILURE); 

} 

fprintf(stdout, "Allocation de %d octets \n", TAI LLE_CHAI NE ) ; 
chaine = mon_malloc_avec_mmap(TAILLE_CHAINE) ; 
if (chaine == NULL) { 

perrorC'mmap"); 

exi t( EXIT_FAI LURE) ; 

} 

fprintf (stdout, "Protections par defaut \n"); 
fprintf (stdout, " Ecriture ..."); 
strcpy(chaine, "Ok"); 
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fprintf (stdout, "Ok\n"); 

fprintf (stdout, "Interdiction de lecture \n"); 

if (mprotecttchaine, TAI LLE_CHAI NE , PR0T_N0NE) < 0) { 

perror( "mprotect" ) ; 

exit(EXIT_FAILURE); 

} 

fprintf (stdout, " Lecture ...\n"); 
fflush(stdout) ; 

fprintf (stdout, "£s\n", chaine); 

/* ici on doit deja etre arrete par un signal */ 

return EXIT_SUCCESS; 

} 

Cette fois-ci nous observons l'effet d'une protection NONE sur une tentative de lecture. Par 
contre, nous interceptons le signal SIGSEGV et nous affichons simplement un message sur le 
flux d'erreur standard. 

$ ./exemple_mprotect_2 

Allocation de 128 octets 
Protections par defaut 

Ecriture ...Ok 
Interdiction de lecture 

Lecture . . . 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
Signal SIGSEGV regu 
(Controle-C) 

$ 

Nous sommes oblige d'arreter avec Controle-C le processus qui part autrement dans un cycle 
infini d'interception de signal et de tentative de lecture sur une zone verrouillee. Un moyen de 
se liberer de ce probleme serait d'utiliser un saut non local depuis le gestionnaire pour revenir 
a un emplacement plus sur du programme. Malgre tout, le fait de detecter une erreur d'acces 
memoire doit plutot etre considere comme un dysfonctionnement a corriger immediatement a 
l'aide du fichier d'image core et d'un debogueur. Le comportement par defaut de SIGSEGV est 
done plus approprie. 
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Conclusion 

Nous avons etudie longuement la gestion de la memoire sous Linux. Ceci nous permet 
- esperons-le - d' avoir une vision claire des mecanismes mis en ceuvre lors des allocations, 
projections ou acces aux zones de la memoire tant physique que virtuelle. 

Le programmeur applicatif a rarement besoin de se soucier des techniques sous-jacentes aux 
allocations dynamiques de memoire. Toutefois, une bonne comprehension de ces phenomenes 
permet de diagnostiquer plus facilement les problemes lorsqu'un programme se comporte de 
maniere a priori surprenante. 

Pour etudier en detail Fespace memoire d'un processus, les meilleures informations pro- 
viennent de l'etude directe des sources du noyau Linux. Toutefois, on trouvera des elements 
interessants dans [Bach 1989] Conception du systeme Unix. 

Le prochain chapitre nous permettra d'etudier ce que nous pouvons faire avec les blocs de 
memoire ainsi obtenus, y compris les traitements concernant les chaines de caracteres. 
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L'emploi des chaines de caracteres et des blocs de memoire sous Linux n'a rien de particulie- 
rement original par rapport aux autres systemes d' exploitation. Par contre, la bibliotheque 
GlibC propose des fonctions tres interessantes, surtout en ce qui conceme les traitements 
de chaines. Certaines de ces fonctions sont assez peu connues et recouvrent pourtant des 
besoins pour lesquels le programmeur est souvent amene a se creer sa propre bibliotheque 
« maison », alors que 1' implementation de la bibliotheque C est generalement mieux opti- 
misee. 

Nous nous interesserons tout d'abord aux differentes variantes des routines permettant de 
manipuler des blocs de memoire brats sans se preoccuper de leur contenu. 

Ensuite, nous verrons les routines de manipulation de chaines de caracteres, notamment celles 
qui sont utilisees pour mesurer la longueur d'une chaine, remplir, copier ou comparer des 
chaines. Puis, nous nous penc herons sur les fonctions permettant de faire des recherches plus 
ou moins complexes de sous-chaines. 

Manipulation de blocs de memoire 

Les fonctions essentielles pour manipuler les blocs de memoire commencent par le prefixe 
mem et sont declarees dans le fichier <string.h>. Sauf mention explicite, les routines presen- 
tees ici sont definies dans le standard C. Les extensions Gnu sont accessibles en definissant la 
constante de compilation _GNU_SOURCE avant l'inclusion des fichiers d'en-tete. 

II existe toutefois des routines devenues quasi obsoletes de nos jours mais qu'on peut rencon- 
trer dans d'anciens fichiers source. Nous les mentionnerons pour information, mais il faudra 
eviter de les utiliser a l'avenir. Avec la GlibC, ces routines sont declarees dans le fichier 
<strings.h> (avec un s). 
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Les blocs de memoire qu'on peut manipuler avec la bibliotheque C sont represented par des 
pointeurs void *. Naturellement, nous declarerons la plupart du temps nos zones de memoire 
avec un autre type, et la conversion sera automatiquement assuree lors de l'invocation des 
routines. Rappelons que le type generique void * peut recevoir n'importe quel type de poin- 
teur sur des donnees, sans declencher d'avertissement du compilateur. 

Lorsqu'on desire acceder au contenu d'un bloc de memoire octet par octet, le plus simple est 
de le declarer de type unsigned char *. Ainsi, nous pourrons adresser directement chaque 
octet et comparer aisement son contenu avec un entier compris entre 0 et 255. Voici comment 
manipuler un tel tableau 1 : 

unsigned char * bloc; 
int i ; 

if ((bloc = malloc(TAILLE_BLOO) == NULL) { 
perrorCmalloc") ; 
exit(EXIT_FAILURE); 

} 

for (i =0; i < TAILLE_BL0C; i ++) { 
bloc[i] = i & OxFF; 

} 

La premiere operation qu'on effectue sur un bloc de memoire est bien souvent de 1' initialiser 
en le remplissant avec une valeur, par ailleurs souvent nulle. La fonction memset( ) assure un 
tel remplissage : 

void * memset (void * bloc, int valeur, size_t longueur); 

Le premier argument pointe sur le bloc a remplir. Le second est une valeur entiere qui sera 
convertie en unsigned char et qui servira a remplir le nombre d'octets indique en troisieme 
argument. memsetO renvoie la valeur du pointeur bloc. L'acces a un bloc de memoire 
n'appartenant pas au processus ou le passage d'un pointeur NULL peuvent declencher le signal 
SIGSEGV. 

L'emploi de l'ancienne fonction bzero( ) est deconseille. Son prototype etait : 

void bzero (void * bloc, size_t longueur); 
Elle ne faisait que remplir le bloc avec des zeros. On peut la remplacer par : 

memset (bloc, 0, longueur). 

II est preferable d'utiliser le plus frequemment possible la fonction memsetO plutot que 
d'essayer d' initialiser manuellement une zone, car cette routine est optimisee, en assurant par 
exemple sur des processeurs x86 des remplissages directement avec des 1 ong int pour diviser 
par 4 le nombre de boucles a effectuer. 

La seconde operation la plus repandue sur les blocs de memoire, apres leur initialisation, 
est probablement la copie. La fonction memcpyO permet de copier des blocs de memoire 
disjoints. Son prototype est : 

void * memcpy (void * destination, void * origine, size_t longueur); 



1. Bien qu'il y ait une difference conceptuelle entre char * chaine et char tableau[], cette distinction ne nous concer- 
nera pas ici. Pour plus de details, on pourra se reporter a la Faq Usenet comp . 1 ang . c. 
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Elle renvoie le pointeur sur la destination, apres y avoir recopie la longueur desiree de la 
chaine originale. 



Attention 

memcpy ( ) ne peut travailler que sur des blocs de memoire disjoints. Si les deux blocs risquent de se recou- 
vrir, il faut utiliser la fonction memmove ( ) decrite plus bas. La norme lso-C99 a d'ailleurs ajoute au langage C 
un mot-cle restrict destine a indiquerque les chaines ne doivent pas se chevaucher. 



La fonction memcpy ( ) est par exemple tres utile pour recopier tous les champs d'une structure : 

void ma_fonction (struct ma_structure * originale) 

{ 

struct ma_structure copie_de_travail ; 

memcpy(& copie_de_travail , originale, sizeof (struct ma_structure) ) ; 

} 

II est du ressort du programmeur de s'assurer qu'il y a suffisamment de place pour recevoir la 
copie du bloc original. 

II existe une extension Gnu, mempcpyO, ayant le meme prototype que memcpy () mais 
renvoyant, a la place d'un pointeur sur le debut de la zone destination, un pointeur sur Foctet 
suivant immediatement le dernier octet ecrit dans la zone destination. Cette adresse est done a 
nouveau utilisable pour une copie. Cela permet notamment de concatener des objets de tailles 
differentes (en vue d'une ecriture groupee sur le disque par exemple) : 

void * 

assembl e_bl ocs (int nb_blocs, size_t tai 1 1 e_bl oc[] , void * bloc[]) 

{ 

void * retour; 
void * cible; 
int tai 1 1 e = 0; 
int i; 

for (i = 0; i < nb_blocs; i++) 

tai lie += taille_bloc[i]; 
if ((retour = mal 1 octtai 1 1 e) ) == NULL) 

return NULL; 
cible = retour; 

for (i = 0; i < nb_blocs; i ++) 

cible = mempcpy(cible, bloc[i], taille_bloc[i]) ; 
return retour; 

} 

La fonction memccpy( ) permet d'effectuer une copie jusqu'a la longueur desiree, ou jusqu'a 
avoir rencontre un caractere donne dans le bloc original. Son prototype est : 

void * memccpy (void * destination, void * source, 
int octet, size_t longueur); 

Si 1' octet d' arret est trouve dans le bloc source, il est copie dans le bloc destination, et 
memccpy ( ) renvoie un pointeur sur le caractere suivant dans le bloc cible. Si la longueur maxi- 
male est atteinte durant la copie sans avoir rencontre l'octet d'arret, memccpyO renvoie un 
pointeur NULL. 
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Vous avez probablement devine que cette routine servira avec les chaines de caracteres, pour 
1' implementation de strncpy( ). Cette fonction est aussi assez utile lorsqu'on traite des blocs 
de donnees provenant de dispositifs industriels ou scientifiques qui utilisent un octet precis de 
synchronisation pour delimiter le debut d'un nouvel ensemble de donnees de longueur 
variable. Cette fonction permet ainsi de lire un bloc jusqu'a Fensemble suivant, tout en 
s'assurant de ne pas deborder de la memoire tampon prevue pour le traitement. 

Nous avons bien precise que les zones de memoire ne doivent pas se chevaucher lors de 
l'utilisation des fonctions de type memcpy( ). Sinon le resultat est indefini car, durant la copie, 
on risque de rencontrer des octets deja places dans le bloc destination. A titre d'exemple naif, 
supposons qu'on ait la situation suivante : 



Source 


Destination 


A B C D 


EFGHIJKLMNOP 


On espere, apres avoir effectue memcpy( destination , source, 12), obtenir : 


Source 


Destination 


A B C D 


ABCDEFGH 1 JKL 


Malheureusement, une fois les 4 premiers octets copies, la routine va lire les 4 suivants, qui 
coincident avec la chaine destination, et au lieu de trouver EFGH, on retrouve ABCD : 


Source 


Destination 


ABCD 


ABCD 1 JKLMNOPl 


La situation se reproduit de nouveau 4 octets plus loin : 


Source 


Destination 


ABCD 


ABCDABCDMNOP 


Ce qui nous conduit finalement a ce resultat, assez eloigne de ce que nous esperions : 


Source 


Destination 


ABCD 


ABCDABCDABCD 



II est pourtant souvent necessaire de deplacer une partie d'un bloc de donnees vers un empla- 
cement le recouvrant partiellement. A titre d'exemple, on peut implementer ainsi un buffer 
lineaire, oil les donnees deja traitees doivent etre ecrasees par celles qui restent a 1' autre bout 
de la memoire tampon. La fonction memmove( ) est utilisee dans ce cas. Son prototype est : 

void * memmove (void * destination, void * source, size_t longueur); 
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Cette routine se comporte exactement comme memcpy( ) lorsque les blocs sont disjoints, mais 
lorsqu'ils se recouvrent, elle assure que la copie obtenue finalement sera exactement une 
image de la source originale au debut de l'appel. Pour cela, elle compare les pointeurs source 
et destination, et determine si elle doit commencer sa copie par le debut (comme nous l'avons 
fait precedemment) ou par la fin du bloc (comme nous aurions du le faire pour que cela fonc- 
tionne). 



Attention 

Le nom de cette fonction ne doit pas engendrer de confusion, il s'agit bien d'une copie, et pas d'un deplace- 
ment. Le bloc original n'est pas modifie s'il n'y a pas de recouvrement avec le bloc destination. 



La fonction memmove( ) necessite de la part de la bibliotheque C un leger surcroit de travail par 
rapport a memcpy( ), puisqu'il faut qu'elle determine le sens de progression de la copie, mais 
elle est quand meme beaucoup plus securisante que cette derniere. 

II existe une fonction obsolete nommee bcopyO qui fonctionnait comme memmoveO, mais 
avec le prototype suivant : 

void bcopy (void * source, void * destination, size_t longueur); 

Elle se comporte comme memmove( ) vis-a-vis des recouvrements de blocs, mais ne renvoie pas 
de pointeur. Pire, ses arguments sont inverses par rapport aux routines memcpy( ) et memmoveO. 
Autrement dit, il ne faut plus l'utiliser ! 

II est possible de comparer deux blocs de memoire. La fonction memcmp( ) assure ce role avec 
le prototype suivant : 

int memcmp (const void * bloc_l, const void * bloc_2, size_t taille); 

Elle renvoie 0 si les deux blocs sont egaux sur la taille indiquee, sinon elle renvoie -1 ou 1 
suivant le signe de la soustraction entre les premiers octets differents entre les deux blocs. 
Cette difference est calculee apres avoir converti les octets sous forme de int. Voyons un 
exemple des divers cas possibles : 

exemplejnemcmp.c : 

#include <stdio.h> 
#include <string.h> 

void 

affiche_resultats (unsigned char * bloc_l, unsigned char * bloc_2, int Ig) 

{ 

int i ; 

fprintf (stdout, "bloc_l = "); 
for (i = 0; i < lg ; i ++) 

fprintf (stdout, "%02d ", bloc_l[i]); 
fprintf (stdout, "\n"); 
fprintf (stdout, "bloc_2 = "); 
for (i = 0; i < lg ; i ++) 

fprintf (stdout, "%02d ", bloc_2[i]); 
fprintf (stdout, "\n"); 
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fprintf (stdout, "memcmptbl oc_l , bloc_2, %d) = %d\n" , 

Ig, memcmp(bl oc_l , bloc_2, lg)); 
fprintf (stdout, "\n"); 

} 



int 
main (void) 
{ 

unsigned char bloc_l[4] = 
unsigned char bloc_2[4] = 
unsigned char bloc_3[4] = 
af f i che_resul tats (bl oc_l , 
af f i che_resul tats (bl oc_l , 
af f i che_resul tats (bl oc_l , 
return EXIT_SUCCESS; 



{ 0x01, 


0x02, 


0x03, 


0x04 


{ 0x01, 


0x02, 


0x08, 


0x04 


{ 0x01, 


0x00, 


0x03, 


0x04 


bloc_l, 


4); 






bloc_2, 


4); 






bloc_3, 


4); 







Attention 

memcmp( ) renvoie le signe du resultat de la soustraction des premiers octets differents, pas la valeur meme 
de la difference. 



$ . /exempt e_memcmp 

bloc_l = 01 02 03 04 
bloc_2 = 01 02 03 04 
memcmptbl oc_l, bloc_2, 4) = 0 



bloc_l = 01 02 03 04 
bloc_2 = 01 02 08 04 
memcmp(bloc_l, bloc_2, 4) = -1 

bloc_l = 01 02 03 04 
bloc_2 = 01 00 03 04 
memcmptbl oc_l, bloc_2, 4) = 1 



$ 

II faut etre tres prudent avec les comparaisons de blocs de memoire. En effet, on aurait 
tendance, a tort, a utiliser cette routine pour comparer des structures par exemple. Mais le 
compilateur insere frequemment des octets de remplissage dans les structures ou dans les 
unions pour optimiser Falignement des divers champs. Ces octets de remplissage n'ont pas de 
valeurs precisement definies et peuvent varier entre deux structures dont les membres sont par 
ailleurs egaux. On ne pourra done pas utiliser memcmp ( ) pour comparer autre chose que des 
donnees binaires « brutes » oil chaque octet a une signification precise. 

Comme toujours, il existe une version obsolete de cette routine provenant de BSD, bcmpO, 
qui est similaire a memcmp ( ) : 

int bemp (const void * bloc_l, const void * bloc_2, int taille) 

Nous nous interesserons aux routines permettant de rechercher des sous-blocs de donnees au 
sein d'une zone de memoire dans la section sur les recherches au cceur d'une chaine. 
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Mesures, copies et comparaisons de chaines 

Avec la bibliotheque C standard, les chaines sont representees par une table de caracteres ter- 
minee par un caractere nul permettant d'en marquer la fin. Lorsqu'on declare une chaine ainsi : 

char * chaine = "Seize caracteres"; 

le compilateur cree une zone de donnees statique initialisee, avec dix-sept caracteres : 



1 


2 


3 


4 


5 6 


7 


8 


9 


10 11 


12 13 


14 15 16 17 


s 


e 


i 


z 


e 


c 


a 


r 


a c 


t e 


r e s \0 



La fonction strlenO renvoie la longueur d'une chaine, sans compter le caractere '\0' final. 
Cette fonction est declaree dans <string.h> ainsi : 

size_t strlen (const char * chaine); 

Pour poursuivre notre exemple, strl en ( "Sei ze caracteres " ) renvoie 16 puisque le caractere 
nul de fin n'est pas compte. Comme les tableaux sont accessibles en C a partir de F element 
d'indice 0, on retrouve toujours : 

chaine [strlen (chaine)] = "\0". 

Lorsqu'on alloue dynamiquement la memoire pour une chaine, on la stocke dans un pointeur 
de type char *. II importe a ce moment de ne pas oublier la place necessaire pour le caractere 
nul final. La fonction strcpy( ) permet de copier une chaine dans une autre. II faut avoir alloue 
suffisamment de place dans la chaine receptrice. Le prototype de strcpy ( ) est le suivant : 

char * strcpy (char * destination, const char * origine); 

La bonne methode pour allouer la memoire indispensable a la reception d'une copie d'une 
chaine est la suivante : 

char * nouvelle; 

if ((nouvelle = malloc(strlen(originale) + 1)) != NULL) 
strcpy(nouvelle, originale); 

else 

perror( "mal 1 oc" ) ; 

Meme une fonction aussi simple que strl en () peut parfois poser des problemes. En effet, 
F implementation d'une telle routine necessite de balayer toute la chaine jusqu'a rencontrer 
un caractere nul, puis de renvoyer le nombre de caracteres parcourus. La veritable implemen- 
tation est optimisee en assembleur dans la bibliotheque GlibC, mais on peut quand meme en 
donner un equivalent fourni par Kernighan et Ritchie : 

size_t 
strlen (const char * s) 
{ 

char * p = s; 
while (* p != '\0') 

p++; 
return p - s; 

} 
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En fait, on renvoie ici la difference arithmetique entre le pointeur sur le caractere nul et le 
pointeur initial. Un probleme grave peut se poser si on ne trouve pas de caractere nul. Imagi- 
nons le traitement de chaines relativement grandes provenant d'un fichier de texte par 
exemple. Malheureusement, l'utilisateur s'est trompe lorsqu'il nous a fourni le nom du fichier 
de texte a lire et il nous a transmis un fichier constitue de donnees binaires, une image 
graphique par exemple, ne contenant - comble de malheur - aucun zero. Que se passe-t-il 
alors ? La fonction strl en( ) va parcourir toute la zone de memoire a la recherche d'un zero 
et, n'en trouvant pas, va deborder sur la suite de la memoire. II est possible que la page 
suivante ne soit pas attribute, et le programme va recevoir subitement un signal SIGSEGV qui 
va le tuer. 

On peut avancer qu'il suffit, avant d'appeler strl en( ), d'ecrire de force un caractere nul a une 
distance arbitraire, suffisamment grande pour correspondre a la plus grande chaine qu'on 
puisse traiter. Dans la plupart des cas, c'est effectivement suffisant, mais nous n'avons pas 
toujours un acces en ecriture sur la page memoire de la chaine a lire, la projection d'un fichier 
par exemple peut avoir uniquement l'autorisation PROT_READ. 

Par ailleurs, la chaine dont il est question peut aussi etre un argument d'entree d'une routine 
declaree sous forme de const char *, done non modifiable (meme si le compilateur ne fournit 
qu'un avertissement et pas une erreur). La chaine peut aussi etre une constante statique dans 
un segment de donnees protege en ecriture. Par exemple, le code suivant declenche une erreur 
de segmentation SIGSEGV : 

void 

modifie_chaine (char * chaine) 
{ 

chaine[0] = "\0" ; 

} 

int 
main (void) 
{ 

modif ie_chaine( "abc" ) ; 
return EXIT_SUCCESS ; 

} 

Pour eviter de deborder d'une chaine en recherchant sa longueur, la bibliotheque GlibC offre 
une fonction strnl en ( ) qui limite la portee de la recherche de la fin de chaine. Elle prend tout 
simplement un argument supplemental pour indiquer la longueur maximale : 

size_t strnl en (const char chaine, size_t longueur_maxi ) ; 

Dans la documentation Gnu, cette fonction est indiquee comme etant equivalente a 

strlen (chaine) < 1 ongueurjnaxi ? strlen (chaine) : 1 ongueurjnaxi 

mais elle n'est heureusement pas implementee comme cela. Tout d'abord, il faudrait stocker 
dans une variable le retour de strl en ( ) et ne pas la rappeler deux fois. Mais de surcroit, cette 
fonction n'arrangerait en rien notre probleme si nous attendions le retour de strlen( ) pour 
limiter sa valeur. En realite, strnl en() est implementee en utilisant memchrO, que nous 
verrons dans la prochaine section, et qui recherche la premiere occurrence du caractere nul 
jusqu'a une certaine distance limite. 
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Pour savoir si on a atteint ou non la longueur maximale, il suffit d' examiner le dernier carac- 
tere qui doit normalement etre nul : 

tan lie = strnlen(chaine, TAI LLE_MAXI_SEGMENT) ; 

if Cchaine[taille] != '\0') { 

/* prevenir 1 'utilisateur et recommencer la saisie */ 
fprintf (stderr, "La chaine fournie est trop longue \n"); 
return ERREUR ; 

1 

Lorsqu'on desire obtenir une copie d'une chaine de caracteres, il n'existe pas moins de huit 
variantes possibles dans la GlibC. La fonction la plus courante est bien entendu strcpyO 
declaree ainsi : 

char * strcpy (char * destination, const char * source); 

Elle copie tous les caracteres contenus de la chaine source, y compris le 0 final, dans la chaine 
destination, et renvoie un pointeur sur cette derniere. Aucune protection n'est fournie en ce 
qui concerne les risques de debordement de la chaine source. Pour cela, il faut utiliser 
strncpy( ) : 

char * strncpy (char * destination, const char * source, 
size_t taille_maxi ) ; 

Le comportement est le suivant : 

• Si la chaine source est plus courte que la taille maximale indiquee, elle est copiee dans la 
chaine destination, puis l'espace restant de la chaine destination est rempli avec des carac- 
teres mils jusqu'a la taille maximale. Ceci sert lorsqu'on veut comparer des zones memoire 
completes, l'etat des caracteres inutilises etant fixe. 

• Si la chaine source est plus longue que la taille maximale indiquee, on ne copie que cette 
derniere longueur. Aucun caractere nul n'est ajoute dans la chaine destination. Nous avons 
vu que cela peut etre une situation a risque pour l'emploi ulterieur de strl en( ). 

Parexemple, strncpy ( destination, "ABCDEFGH", 12) remplit la chaine de destination ainsi : 



A 


B 


C 


D 


E 


F 


G 


H 


\0 


\0 


\0 


\0 



Alors que strncpy(destination , "ABCDEFGH" , 5) remplit la chaine de destination ainsi 



ABODE 



sans qu'il y ait de caractere nul ajoute. 

Le programmeur prudent pourra done utiliser des routines du genre : 

char * destination; 
size_t longueur; 

if ((destination = mal 1 oc( LONGUEUR_MAXI_CHAI NES + 1 ) ) == NULL) { 
/* traitement d'erreur */ 
[...] 

1 
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destination[LONGUEUR_MAXI_CHAINES] = '\0'; 
strncpy(destination, source, LONGUEUR_MAXI_CHAINES) ; 
[...] 

longueur = strnlentdestination, LONGUEUR_MAXI_CHAINES) ; 
if (longueur == LONGUEUR_MAXI_CHAINES) { 

/* traitement d'erreur*/ 

[...] 

} 

Les fonctions stpcpy ( ) et stpncpy ( ) ont exactement la meme syntaxe et la meme signification 
que strcpyO et strncpy ( ), mais elles renvoient un pointeur different : 

• stpcpy( ) renvoie un pointeur sur le caractere nul final de la chaine destination. 

• stpncpy ( ) renvoie un pointeur sur le caractere situe dans la chaine destination, immediate- 
ment apres le dernier caractere ecrit, si la chaine source est plus longue que la taille maxi- 
male indiquee. 

• stpncpy( ) renvoie un pointeur sur le premier caractere nul ecrit dans la chaine destination 
si la chaine source est plus courte que la taille maximale. La chaine destination est dans ce 
cas completee avec des zeros jusqu'a la longueur maximale, mais on renvoie un pointeur 
sur le premier caractere nul ajoute. 

Ces fonctions sont disponibles dans la GlibC en tant qu'extensions Gnu, meme s'il s'agit 
probablement de routines provenant du monde Dos. En renvoyant un pointeur sur la fin de la 
chaine, elles permettent de faire des concatenations successives. Nous allons creer une fonc- 
tion prenant en argument une chaine destination, une longueur maximale, suivies d'un 
nombre quelconque de chaines et d'un pointeur NULL final. Cette routine va concatener toutes 
les chaines transmises dans la chaine destination, en surveillant qu'il n'y ait pas de deborde- 
ment, caractere nul final compris. 

exemple_stpncpy.c : 

#define _GNU_SOURCE 

#include <stdarg.h> 
#include <stdio.h> 
#1nclude <string.h> 

void 

concatenation (char * destination, size_t taille_maxi, ...) 
{ 

va_list arguments; 
char * source; 
char * retour; 
size_t taille_chaine; 

retour = destination; 
taille_chaine = 0; 
va_start(arguments, taillejnaxi ); 
while (1) { 

source = va_arg(arguments, char *); 

if (source == NULL) 

/* fin des arguments */ 
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break; 

retour = stpncpytretour, source, taille_maxi - taille_chaine) ; 
taille_chaine = retour - destination; 
if (taille_chaine == tai 1 1 e_maxi ) { 

/* Ecraser le dernier caractere par un zero */ 

retour --; 

* retour = "\0" ; 

break; 

} 

} 

va_end(arguments) ; 

} 



int 
main (void) 

{ 

char chaine[20]; 



concatenationtchaine, 20, "123", "456", "7890", "1234", NULL); 
fprintf (stdout, "£s\n", chaine); 

concatenationtchaine, 20, "1234567890", "1234567890", "123", NULL); 
fprintf (stdout, "&s\n", chaine); 
return EXIT_SUCCESS; 

} 

L' execution nous permet de verifier que notre concatenation fonctionne bien, tout en ne depas- 
sant jamais la longueur maximale indiquee : 

$ . /exemple_stpncpy 

12345678901234 

1234567890123456789 

$ 

II existe deux fonctions, strdup( ) et strndup( ) , particulierement pratiques, car elles assurent 
F allocation memoire necessaire pour stocker la chaine destination. Elles sont declarees ainsi : 

char * strdup (const char *chaine); 

char * strndup (const char * chaine, size_t longueur); 

Elles renvoient toutes deux un pointeur sur la copie nouvellement allouee de la chaine, ou 
NULL en cas d'echec dans mal 1 oc( ). La fonction strndup( ) ne copie au plus que la longueur 
indiquee, y compris le caractere nul final. La chaine renvoyee se termine done toujours par un 
zero. Bien entendu, il faut liberer les chaines renvoyees en invoquant f ree( ) une fois qu'on a 
fini de les utiliser. 

Deux fonctions supplementaires existent en tant qu'extensions Gnu: strdupaO et strn- 
dupa( ). Elles se presentent exactement comme strdup( ) et strndupt ), mais la copie de chaine 
est allouee dans la pile en utilisant la fonction all oca( ), et non mallocC ). II ne faut done pas 
tenter d'appeler f ree( ) avec le pointeur renvoye, car Fespace occupe par la chaine sera auto- 
matiquement libere au retour de la fonction (ou lors d'un saut non local longjtnp). Pour ces 
deux fonctions, on prendra done les precautions qui s'imposent vis-a-vis de Femploi de varia- 
bles allouees dynamiquement dans la pile avec allocaO, comme nous l'avons vu dans le 
chapitre traitant de la gestion de Fespace memoire du processus. 
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Aucune des fonctions de copie que nous avons examinees ne permet de copier des chaines se 
recouvrant partiellement. II est pourtant utile de deplacer des parties d'une chaine a l'interieur 
d'elle-meme. Cela permet par exemple d'eliminer les espaces en debut de ligne. La seule 
fonction acceptable pour cela est memmove( ), mais elle nous oblige a rechercher nous-meme 
la fin de la chaine. Nous verrons comment implementer de maniere assez performante une 
elimination des blancs en debut et fin de chaine, dans la prochaine section, car nous utilise- 
rons les fonctions strchr( ) et strspn( ) que nous analyserons alors. 

II est egalement frequent d' avoir besoin d'ajouter une portion de chaine a la fin d'une autre. 
Par exemple, on prepare phrase par phrase un texte en fonction de divers parametres, puis le 
texte est affiche ou transmis a une routine de sauvegarde, de presentation dans un composant 
d'interface graphique, etc. Plusieurs methodes sont possibles pour concatener des chaines, a 
commencer par strcpy ( ) qui utilise un pointeur sur la fin de la chaine destination. Nous avons 
egalement ecrit une routine de ce type dans l'exemple precedent, avec stpncpyO. II est 
toujours envisageable d' employer sprintf ( ). La fonction dont on se sert le plus couramment 
est pourtant strcat( ), ainsi que son acolyte strncat( ) qui permet par precaution de limiter la 
longueur de la chaine receptrice. Leurs prototypes sont declares ainsi : 

char * strcat (char * destination, const char * a_ajouter); 

char * strncat (char * destination, const char * a_ajouter, size_t taille); 

La taille indiquee dans l'appel de strncat( ) est celle de la portion qui peut etre ajoutee a la 
chaine destination. Avant l'appel de strncat( ), la chaine destination doit done disposer d'une 
taille totale valant au moins strlen(destination) + taille + 1 (pour le caractere mil final). 
L'exemple suivant va nous permettre d'utiliser strncatO pour concatener les arguments 
d'appel de la fonction, tout en limitant la taille totale. La valeur 20 est choisie arbitrairement 
pour imposer une limite volontairement basse. 

exemple_strncat.c : 

#include <stdio.h> 
#1nclude <string.h> 

#define LG_MAXI 32 /* 20 + 12, cf. plus bas */ 
int 

main (int argc, char * argv[]) 
{ 

int i; 

int taille; 

char chaine[LG_MAXI + 1]; 

strcpy(chaine, "Arguments : "); /* deja 12 caracteres */ 
for (i =1; i < argc; i ++) { 

taille = strlen(chaine) ; 

strncat(chaine, argv[i], LG_MAXI - taille); 

} 

fprintf (stdout, "£s\n", chaine); 
return EXIT_SUCCESS; 

} 
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Lors de l'execution, la chaine est bien limitee a 32 caracteres (20 pour les arguments, et 12 
pour Faffichage de « Arguments : »), auxquels s'ajoute un caractere nul que nous avons 
compte lors de la declaration de la chaine. 

$ ./exemple_strncat 12345 678 90 1 

Arguments : 12345678901 

$ ./exemple_strncat 123456789 01 23 45678 

Arguments : 123456789012345678 

$ ./exemple_strncat 123456789 01 23 45678 90123 

Arguments : 12345678901234567890 
$ 

Ces fonctions sont loin d'etre optimales pour leur role car elles necessitent, au sein de la 
routine, de recalculer la longueur de la chaine destination avant de commencer la copie. Le 
pire c'est qu'avec strncat( ) nous devons disposer, avant l'appel, de la longueur actuelle de la 
chaine, et nous invoquons done strlen( ) une fois de plus. Toutes ces etapes pourraient etre 
evitees en utilisant les fonctions stpcpy( ) ou stpncpy( ) et en conservant la trace du pointeur 
renvoye, comme nous l'avons fait dans l'exemple de stpncpy( ). 

Nous allons a present nous interesser aux fonctions permettant de comparer des chaines de 
caracteres. Ces routines peuvent bien entendu servir a des comparaisons simples, mais aussi 
pour trier des listes de mots par exemple. Les routines de tri que nous etudierons dans le 
chapitre 17 reclament en effet un pointeur sur une fonction fournissant une relation d'ordre 
sur l'ensemble des elements a classer. On peut tres bien utiliser les fonctions de comparaison 
pour implementer cette relation d'ordre. 

La routine la plus simple est strcmp( ) dont le prototype est : 

int strcmp (const char * chaine_l, const char * chaine_2); 

Si les deux chaines sont identiques, strcmp ( ) renvoie 0. Sinon, elle renvoie une valeur dont le 
signe correspond au resultat de la soustraction entre les premiers caracteres qui different entre 
les deux chaines. La comparaison des caracteres est realisee en les considerant comme des 
unsigned char (done allant de 0 a 255), qu'on convertit en int pour avoir un resultat signe. 

Le resultat est assez intuitif par rapport a l'ordre du dictionnaire par exemple, et correspond 
aux cas suivants : 

• strcmp(chaine_l , chaine_2) = 0 si les deux chaines sont egales. 

• strcmp(chaine_l, chaine_2) < 0 si la premiere chaine est a classer avant la seconde. 

• strcmp(chaine_l, chaine_2) > 0 dans le cas contraire. 
Voici un exemple des differents resultats possibles : 



chaine 1 




chaine 2 


signe de strcmpo 




ABCDE 


ABCDE 




strcmpt) = 0 




ABCDE 


ABCDZ 




strcmpO < 0 




ABCZ 


ABCDE 




strcmpt ) > 0 




ABCDE 


ABC 




strcmpO > 0 
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Le caractere de fin de chaine etant nul, il est plus petit que tous les autres caracteres. Si une 
chaine est plus courte qu'une autre, elle sera done considered comme etant inferieure, meme 
si tous les autres caracteres sont egaux. 

La fonction strncmp( ) fonctionne de la meme maniere que strcmp( ), mais dispose d'un argu- 
ment supplementaire : 

int strncmp (const char * chaine_l, 
const char * chaine_2, 
size_t longueur) ; 

Elle ne compare que la longueur indiquee des deux chaines, sans aller necessairement jusqu'a 
leur fin. Cette fonction est particulierement utile lorsqu'une application autorise des saisies de 
mots-cles abreges. Dans ce cas, on comparera successivement la chaine saisie avec le vocabu- 
laire de reference, en se limitant a la longueur de la saisie. Si on trouve une correspondance, 
on accepte alors Fabreviation. Voici un exemple d'une telle routine, qui explore un vocabu- 
laire contenu dans une table de chaines de caracteres. Elle renvoie le numero du mot saisi, ou 
-1 en cas d'erreur. Cette fonction va meme refuser les saisies ambigues, si deux mots peuvent 
servir de complements. 

int 

recherche_correspondance (const char * saisie) 
{ 

int i; 

int longueur; 

int trouve = -1; 

longueur = strlen(saisie) ; 

for (i =0; i < Nombre_de_mots ; i ++) { 

if (strncmp(chaine, Tabl e_des_mots[i ] , longueur) == 0) { 
if (trouve != -1) { 

fprintf (stderr, "Saisie ambigue, completez le mot \n"); 
return -1; 

} 

trouve = i ; 

} 

} 

if (trouve == -1) 

fprintf (stderr, "Saisie inconnue \n"); 
return trouve; 

} 

Le probleme des fonctions strcmp( ) et strncmp( ) est qu'elles sont souvent trop rigides pour 
les saisies effectuees avec une interface utilisateur conviviale. On aimerait par exemple offrir 
a Futilisateur la possibility de s'affranchir de la casse 1 des caracteres, e'est-a-dire des diffe- 
rences entre majuscules et minuscules. Meme si cette differentiation est souvent importante et 
obligatoire (symboles du langage C, noms de fichiers sous Unix. . .), on peut avoir envie de rela- 
cher la contrainte envers Futilisateur, quitte a modifier automatiquement la saisie par la suite. 



1. La casse est un terme de typographic representant la boite compartimentee ou etaient ranges les caracteres en plomb. 
Le haut-de-casse etait occupe par les lettres majuscules, les capitales, et le bas-de-casse contenait les minuscules. Les 
Anglais ont conserve cette notion dans leur vocabulaire avec uppercase (majuscule) et lowercase (minuscule), que nous 
retrouverons dans certains noms de fonctions. 
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II existe deux fonctions, strcasecmp( ) et strncasecmp( ), avec les memes prototypes que 
strcmpC ) et strncmp( ) , et renvoyant des valeurs de retour similaires (0 pour l'egalite, et une 
valeur de meme signe que la difference sinon). Toutefois, ces deux fonctions presentent 
Favantage de ne pas etre sensibles aux differences entre majuscules et minuscules. Par 
exemple, AbC et aBc sont considerees comme etant egales. 

Mieux, ces fonctions sont directement configurables par l'utilisateur pour ce qui concerne 
leur comportement avec les caracteres accentues. En effet, la table Ascii classique (fournie en 
annexe) ne contient que des caracteres non accentues. Les fonctions strcasecmp( ) et strn- 
casecmp( ) ont un comportement parfaitement normal avec ces caracteres. Mais il ne s'agit la 
que de la premiere moitie de l'espace utilisable pour les valeurs d'un octet. Le standard Ascii 
ne normalise que les valeurs allant de 0 a 127. 

Toutefois, l'utilisateur francophone sera probablement interesse par d'autres caracteres, 
comme e, e, a, etc. Ces derniers, ainsi que les caracteres accentues utilises par les autres 
langues ouest-europeennes, sont regroupes par un autre standard, complementaire, s'etendant 
de 128 a 255 et nomme ISO-8859-1. II existe d'autres tables internationales pour d'autres 
alphabets, mais nous nous limiterons dans nos exemples au 8859-1, qui est rappele en annexe. 

Lorsqu'un utilisateur configure sa localisation, il peut indiquer, par le biais de variables d'envi- 
ronnement, ses preferences pour le comportement des programmes. Par exemple, les messages 
d'erreur des applications Gnu sont pour la plupart traduits dans la majorite des langues. II 
suffit de configurer la variable d'environnement LANG ou LC_ALL pour obtenir cette traduction : 

$ unset LC_ALL 
$ unset LANG 
$ Is inexistant 

Is: inexistant: No such file or directory 
$ export LANG=fr_FR 
$ Is inexistant 

Is: inexistant: Aucun fichier ou repertoire de ce type 
$ 

Nous avons efface tout d'abord les deux variables LC_ALL et LANG pour etre sur qu'il ne reste 
plus de localisation valide. Le premier message d'erreur de Is etait en anglais. Apres avoir 
defini LANG a f r_FR (francophone de France), le second message d'erreur est traduit. II n'y a 
aucun besoin de recompiler 1' application ni de modifier des fichiers systeme, tout se passe 
simplement grace a la configuration d'une variable d'environnement. Nous consacrerons un 
chapitre complet a F etude de la localisation, mais nous allons simplement indiquer des a 
present qu'en invoquant la commande suivante 

setlocale (LC_ALL, ""); 

en debut de programme, on demande aux routines de la bibliotheque C qui le peuvent de tenir 
compte des variables d'environnement configurees par l'utilisateur pour ses preferences. 

Les routines strcasecmp( ) et strncasecmpt ) utilisent done les regies de localisation pour deter- 
miner si deux lettres sont egales. II faut noter que, dans la localisation f r_FR par exemple, la 
majuscule associee au caractere 'e' est et pas 'E'. Dans le cas d'une saisie de donnees pour 
des comparaisons de mots-cles (moteur de recherche web ou logiciel de documentation 
bibliographique, par exemple), il sera probablement necessaire d'ecrire une routine personna- 
lisee pour remplacer totalement les caracteres accentues par leur correspondant sans accents. 
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Ceci peut se faire tres facilement au moyen d'une simple table de transcodage, avec une 
legere complication introduite par les lettres doubles comme a (dans ncevus par exemple), 
qu'il faudra traiter comme une exception. 

Voyons un exemple d' utilisation de strcasecmp( ). 
exemple_strcasecmp.c : 

#include <stdio.h> 
#1nclude <string.h> 
//include <locale.h> 

int 

main (int argc, char * argv[]) 
{ 

int compar; 

setlocale(LC_ALL, ""); 
if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s chaine_l chaine_2\n", argv[0]); 

exit(EXIT_FAILURE); 

} 

compar = strcasecmp(argv[l] , argv[2]); 
fprintf (stdout, "%s %c %s \n", argv[l], 

(compar > 0 ? ">' : (compar == 0 ? '=' : '<* )), 

argv[2]) ; 
return EXIT_SUCCESS ; 

} 

Le fait d' employer la ligne set local e( . . . ) en debut de programme rend notre application 
sensible a la localisation : 

$ unset LC_ALL 
$ unset LANG 

$ ./exemple_strcasecmp AbCd aBcD 

AbCd = aBcD 

$ ./exemple_strcasecmp aETO Aelo 

aETO > Aelo 

$ export LC_ALL=fr_FR 

$ ./exemple_strcasecmp aETO Aelo 

aETO = Aelo 

$ ./exemple_strcasecmp aETO aeio 

aETO > aeio 
$ 

Dans la localisation americaine par defaut, les caracteres superieurs a 128 sont tous differents, 
sans lien entre eux. Dans la localisation francophone, les accentuations sont reconnues, mais 
le dernier exemple montre bien qu'il n'y a pas de rapprochement entre la lettre accentuee et la 
lettre vierge. 

Le probleme est que le caractere '§', de code ISO-8859-1 0xE9 , est situe bien apres les lettres 
'a' a 'z' sans accents qui s'etendent de 0x61 a 0x7A. Autrement dit, le mot eternite est classe 
apres zygomatique. Difficile de creer un dictionnaire ainsi ! Heureusement, il existe une 
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fonction de comparaison prenant en compte la localisation. Cette fonction ordonne les carac- 
teres accentues a leur emplacement naturel pour la langue configuree. A titre d'exemple, voici 
le classement des caracteres utilises en francais : 

AaAa^sBbCcgfDdEeEeEeEeEeFfGgHhlililiJjKkLlMmNnO 
oOoOoPpQqRrSsTtUuUutJuUiiVvWwXxYyZz 

En realite, le classement est plus complique car l'ordre au sein des variantes d'une meme 
lettre n'est pas pris en compte si la suite du mot comporte des differences. Par exemple, 
« tue » est place avant « tue », mais ce dernier est situe avant « tueur ». 

Ce classement est, cette fois-ci, tout a fait correct pour organiser un dictionnaire. La fonction 
de comparaison permettant cette organisation s'appelle strcol 1 ( ) et elle a la meme syntaxe 
que strcmp( ) : 

int strcoll (const char * chaine_l, const char * chaine_2); 

II faut, bien entendu, initialiser la localisation avec setlocaleO au debut du processus. On 
reprend le meme programme que exempl e_strcasecmp.c, en remplacant simplement l'appel 
de strcasecmp( ) par strcol 1 (argv [1], argv [2] ). Voici quelques comparaisons : 

$ unset LC_ALL 

$ unset LANG 

$ ./exemple_strcoll e f 

e > f 

$ export LC_ALL=fr_FR 
$ ./exemple_strcoll e f 

e < f 

$ . /exempl e_strcol 1 E e 
E < e 

$ . /exempl e_strcoll u u 

u < u 

$ . /exempl e_strcoll u V 

u < V 
$ 

La fonction strcoll () est particulierement bien adaptee pour les tris lexicographiques, en 
classant des donnees suivant l'ordre alphabetique correct. Malgre tout, elle est assez couteuse 
en termes de temps, car a chaque comparaison les deux chaines doivent etre copiees dans une 
version modifiee pour prendre en compte la localisation. Cette modification a lieu au sein de 
la bibliotheque C. Lorsqu'on desire ordonner un grand nombre de chaines, chacune d'elles 
est comparee a plusieurs reprises avec ses voisines et, a chaque comparaison, on repasse par 
l'etape de modification tenant compte de la localisation. 

La bibliotheque C nous offre la possibility d'acceder directement a la routine de modification 
des chaines. Ainsi, il est possible d'obtenir une copie modifiee de chaque chaine en fonction 
de la localisation. On pourra ensuite utiliser la routine strcmp( ) directement sur les chaines 
modifiees, et on obtiendra le meme resultat final qu'en employant strcol 1 ( ). Dans la locali- 
sation « C » par defaut, les chaines copiees sont exactement identiques aux originales puisque 
l'ordre des caracteres est celui de la table Ascii. Dans les autres localisations, les chaines 
contiennent des caracteres supplementaires destines a permettre le tri, mais rendant les copies 
modifiees illisibles. II faut done bien conserver la version originale. En fait, la modification 
remplace les caracteres par des sequences plus ou moins longues permettant de retrouver 
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l'ordre naturel de tri suivant la localisation. C'est pour cela que la chaine copiee n'est pas 
directement lisible. La routine de modification est strxf rm( ), dont le prototype est le suivant : 

size_t strxfrm (char * destination, 
const char * origine, 
size_t taillejnaxi ) ; 

Elle copie la chaine d' origine, en la modifiant, dans la chaine destination, en n'y placant que 
le nombre maximal de caracteres indique, sans compter le caractere nul final. Cette fonction 
renvoie le nombre de caracteres necessaires pour copier la chaine d'origine. Lorsque la taille 
maximale indiquee vaut zero, la fonction ne touche pas a la chaine de destination. On utilise 
done generalement strxfrm( ) en deux fois, le premier appel avec strxf rm(NULL, chaine, 0) 
permet de connaitre le nombre de caracteres necessaires pour la destination. On effectue 
l'allocation (en ajoutant un octet pour le caractere nul final), et on peut appeler strxf rm() 
avec tous ses arguments a ce moment-la. 

Le programme suivant demontre que l'ordre obtenu avec strcmp( ) sur des chaines fournies 
par strxf rm( ) est le meme que celui qui est obtenu avec strcol 1 ( ) sur les chaines originales. 

exemple_strxfrm.c : 

#include <stdio.h> 

#1nclude <stdlib.h> 

#1nclude <string.h> 

//include <locale.h> 

int 

main (int argc, char * argv[]) 
{ 

char * chaine_l = NULL; 
char * chaine_2 = NULL; 
size_t taille_l; 
size_t taille_2; 
int compar; 

setlocale(LC_ALL, ""); 
if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s chaine_l chaine_2\n" , argv [0]); 

exit(EXIT_FAILURE); 

} 

taille_l = strxfrm(NULL, argv[l], 0); 
taille_2 = strxf rm(NULL, argv[2], 0); 
if (((chaine_l = mal 1 octtai 1 1 e_l + 1) ) == NULL) 
|| ((chaine_2 = mal 1 octtai 1 1 e_2 + 1) ) == NULL)) { 

perrorC'malloc"); 

exit(EXIT_FAILURE); 

} 

strxf rm(chaine_l , argv[l], taille_l); 
strxfrm(chaine_2, argv[2], taille_2); 
compar = strcmp(chaine_l, chaine_2); 

fprintf (stdout, "strxfrm / strcmp : %s %c %s\r\" , argv[l], 

(compar == 0 ? '=' : (compar < 0 ? '<' : ">')), argv[2]); 
compar = strcol 1 (argv[l] , argv[2]); 
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fprintf (stdout, "strcoll : %s %c %s\n", argv[l], 

(compar == 0 ? '=' : (compar < 0 ? '<' : '>')), argv[2]); 
return EXIT_SUCCESS; 

} 

Les comportements sont bien identiques : 

$ ./exemple_strxfrm A a 

strxfrm / strcmp : A < a 

strcoll : A < a 

$ ./exemple_strxfrm a a 

strxfrm / strcmp : a < a 

strcoll : a < a 

$ ./exemple_strxfrm a B 

strxfrm / strcmp : a < B 

strcoll : a < B 

$ 

Pour effectuer le tri d'une table de caracteres, on peut creer une structure contenant un poin- 
teur sur la chame originale et un pointeur sur une chaine copie (a allouer), creer une table de 
ces structures et demander a une routine de tri - comme qsort( ) , que nous verrons plus loin - 
de faire automatiquement le classement. II faut passer, en argument a qsort( ), un pointeur sur 
une fonction de comparaison. Celle-ci utilisera strcmp( ) sur les chaines modifiees. 

exemple_strxfrm 2.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <string.h> 

#include <locale.h> 

typedef struct { 

char * originale; 

char * modifiee; 
} element_t; 

int 

compare_el ements (const void * objet_l, const void * objet_2) 
{ 

element_t * elem_l = (element_t *) objet_l; 

element_t * elem_2 = (element_t *) objet_2; 
return strcmptel em_l -> modifiee, elem_2 -> modifiee); 

} 

void 

trie_table_mots (int nbjnots, char * tabl e_mots[] ) 

{ 

element_t * tabl e_el ements; 

size_t taille; 

int i ; 



tabl e_el ements = cal 1 oc(nb_mots , sizeof(element_t)); 
if (tabl e_el ements == NULL) { 
perror( "cal 1 oc" ) ; 
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exit(EXIT_FAILURE); 

} 

for (i =0; i < nbjnots; i ++) { 

table_elements[i].originale = tabl e_mots[i ] ; 

taille = strxfrm(NULL, table_elements[i].originale, 0); 

table_elements[i ] .modifiee = mal 1 oc(tai 1 1 e + 1); 

if (table_elements[i ] .modifiee == NULL) { 

perrort "mal 1 oc" ) ; 

exit(EXIT_FAILURE); 

} 

strxfrm(table_elements[i ] .modifiee, 
table_elements[i ] .original e, 
taille) ; 

} 

qsort(tabl e_el ements , nbjnots, sizeof(element_t) , compare_elements); 
for (i = 0; i < nb_mots; i ++) { 

fprintf (stdout, "%s\n", table_elements[i].originale); 

free (tabl e_el ements [i ] .modi f iee) ; 

} 

free (tabl e_el ements ) ; 



int 

main (int argc, char * argv[]) 
{ 

setlocale(LC_ALL, ""); 
if (argc < 2) { 

fprintf (stderr, "Syntaxe : %s mots...\n", argv[0]); 

exit(EXIT_FAILURE); 

} 

trie_table_mots(argc - 1, & (argv[l])); 
return EXIT_SUCCESS; 

} 

Voici un exemple : 

$ ./exemple_strxfrm_2 exercice executer examiner excuse exces 

examiner 

exces 

excuse 

executer 

exercice 

$ ./exemple_strxfrm_2 exe exe 

exe 
exe 

$ ./exemple_strxfrm_2 exerce execute 

execute 

exerce 

$ 



Nous remarquons d'ailleurs au passage que l'ordre des caracteres accentues par rapport aux 
caracteres non accentues n'a d'influence sur le classement que si la suite des deux mots est 
differente. C'est le meme comportement que dans un dictionnaire courant. 
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Recherches dans une zone de memoire ou dans une chame 

II arrive frequemment qu'on ait besoin de rechercher un caractere precis dans une zone de 
memoire ou dans une chame. Cette recherche dans une zone de memoire peut servir, par 
exemple, a retrouver des delimiteurs de blocs dans un ensemble de donnees binaires. Au sein 
d'une chaine, on cherche regulierement le caractere nul final evidemment, mais aussi des 
separateurs de mots, comme Fespace ou la tabulation. Nous allons voir plusieurs fonctions 
permettant ce genre d'exploration. 



Recherche dans un bloc de memoire 

La fonction la plus simple est memchr( ), dont le prototype est le suivant : 

void * memchr (const void * bloc, int octet, size_t longueur); 

Elle recherche la premiere occurrence de 1' octet indique en second argument, dans le bloc 
sur lequel on fournit un pointeur et dont on precise la longueur. Le pointeur renvoye corres- 
pond a l'octet trouve ou est NULL si aucune correspondance n'a ete trouvee dans la longueur 
voulue. 

Cela nous permet d'implementer de maniere efficace la fonction strnl en( ) que nous avions 
vue plus haut : 

size_t 

strnlen (const char * chaine. size_t tai 1 1 ejnaxi ) 
{ 

void * fin; 

fin = memchr( chaine, 0, taillejaxi ) ; 
if (fin == NULL) 

return (tai 1 1 e_maxi ) ; 
return fin - chaine; 

} 

Precisons tout de suite que F implementation interne de memchr ( ) dans la bibliotheque C est 
loin d'etre triviale. II ne s'agit pas d'un « bete » : 

for (i = 0; i < longueur; i ++) 
if (bloc[i] == octet) 
return & (bloc[i]); 
return NULL; 

En realite, non seulement cette routine est optimisee en assembleur, mais de plus elle emploie 
un algorithme astucieux permettant de faire la recherche directement dans des blocs de 4 ou 
8 octets suivant la machine. Tout comme les autres fonctions d'acces a la memoire ou aux 
chaines de caracteres, Foptimisation de cette routine poussera le programmeur a y avoir 
recours le plus souvent possible et a eviter toute implementation personnelle d'une fonction 
existante. 

II existe une extension Gnu, nommee rawmemchr( ), fonctionnant comme memchr( ) mais sans 
indiquer de longueur maximale. Etant donne l'effet devastateur d'une telle routine quand on 
ne trouve pas l'octet recherche, nous nous abstiendrons de l'utiliser. 

A part quelques cas precis que nous avons evoques plus haut, la recherche de donnees dans un 
bloc de memoire est rarement limitee a un seul octet. On a souvent besoin de determiner la 
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position d'un sous-ensemble d'un bloc. Pour cela, la bibliotheque GlibC fournit une exten- 
sion memmem( ) interessante : 

void * memmem (const char * bloc, size_t lg_bloc, 

const char * sous_bloc, size_t lg_sous_bloc); 

Cette fonction renvoie la position de la premiere occurrence du sous-bloc au sein du bloc 
complet, ou NULL s'il n'a pas ete trouve. II faut etre tres prudent avec memmem( )et ne jamais lui 
transmettre un sous-bloc de taille nulle, car le comportement est different suivant les imple- 
mentations de la bibliotheque C. Une attitude sage consiste a considerer le comportement de 
cette routine comme indefini si le sous-bloc est vide. 

Les fonctions memchr( ) et memmem ( ) constituent done les deux routines-cles pour le travail sur 
les blocs de memoire. II existe toutefois de tres nombreuses autres fonctions, permettant cette 
fois-ci de travailler sur des chaines de caracteres. 

Recherche de caracteres dans une chaine 

La fonction strchrO est semblable dans son principe a memchr( ), la limite de la recherche 
etant evidemment la fin de la chaine, sans qu'on ait besoin de la preciser explicitement : 

char * strchr (const char * chaine, int caractere); 

Cette fonction renvoie un pointeur sur le premier caractere correspondant trouve, ou NULL en 
cas d'echec. On peut rechercher n'importe quel caractere, y compris le nul final. Cela peut 
etre interessant dans le cas ou on voudrait disposer d'un pointeur sur la fin de la chaine, pour 
y ajouter quelque chose ou pour la parcourir vers l'arriere (elimination des sauts de lignes, 
espaces, tabulations en fin de chaine, par exemple). 

Au lieu d'ecrire quelque chose comme 
char * suite; 

suite = & (origine[strlen(origine)] ) ; 

ou a la limite 

suite = origine + strlen(origine) ; 

qui presente les dangers de toutes les manipulations arithmetiques de pointeurs, on peut 
utiliser 

suite = strchrtorigine, '\0'); 
qui evite un calcul inutile. 

Rappelons que dans la GlibC, les routines de recherche de caracteres sont parfaitement opti- 
misees pour parcourir la chaine par blocs de 4 ou 8 octets, et on a tout interet a y faire appel 
plutot que de tenter de balayer la chaine directement. On peut employer strchr( ) pour recher- 
cher des separateurs dans des enregistrements de donnees se presentant sous forme de texte, 
comme les deux-points dans les lignes du fichier /etc/passwd par exemple, mais nous verrons 
un peu plus loin des fonctions mieux adaptees a ce type de travail. 

La fonction strrchr( ) presente le meme prototype que strchr( ) 
char * strrchr (const char * chaine, int caractere); 
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mais elle s'interesse a la derniere occurrence du caractere dans la chaine. Elle peut servir par 
exemple a rechercher le dernier caractere 7' dans un chemin d'acces, pour ne conserver que 
le nom d'un fichier. II existe une fonction basenameO dans la GlibC qui effectue ce travail, 
mais elle n'est pas toujours definie car il y a un conflit avec une autre fonction basename( ) du 
groupe XPG. L' implementation Gnu est en substance la suivante : 

char * 

basename (const char * nom_de_fichier) 
{ 

char * retour; 

retour = strrchr(nom_de_fichier, '/'); 
if (p == NULL) 

/* le nom de fichier n'a pas de prefixe */ 

return nom_de_fichier; 

/* 

* On renvoie un pointeur sur le nom situe immediatement 

* apres le dernier / 
*/ 

return p + 1; 

} 

II existe deux fonctions obsoletes, indexO et rindexO, qui sont respectivement des syno- 
nymes exacts de strchr( ) et strrchr( ). On risque toujours de les rencontrer dans d'anciens 
fichiers source, mais il ne faut plus les employer car non seulement elles sont amenees a 
disparaitre, mais pire, les noms de ces fonctions sont mal choisis et peu revelateurs de leur 
role. 



Recherche de sous-chames 

A l'instar de memchrO qui est souvent moins utile que memmem( ), les fonctions strchrO et 
strrchr( ) ont besoin d'etre completees par une routine de recherche de sous-chaine entiere. 
II existe plusieurs variantes, la plus courante etant, on s'en doute, appelee strstr( ) : 

char * strstr (const char *chaine, const char * sous_chaine) ; 

Cette fonction retourne un pointeur sur la premiere occurrence de la sous-chaine recherchee 
au sein de la chaine mentionnee. Si aucune correspondance n'est trouvee, cette routine 
renvoie un pointeur NULL. Si la sous-chaine est vide, le pointeur renvoye correspond au debut 
de la chaine. Toutefois, si on desire assurer la portabilite d'un programme, on evitera ce 
comportement extreme, comme avec memmemt ), car d'autres bibliotheques C peuvent avoir un 
resultat different. 

L'utilisation de strstr( ) est simple : 
exemple_strstr.c : 

#include <stdio.h> 
#include <string.h> 

int 

main (int argc, char * argv[]) 
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{ 

int i; 
char * chaine; 

if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s chaine sous-chaine \n", argv[0]); 
exit(EXIT_FAILURE); 

} 

if (strlen(argv[2]) == '\0') { 

/* Cela peut arriver si on a lance le programme avec 
* argument "" sur la ligne de commande. 
*/ 

fprintf (stderr, "La sous-chaine recherchee est vide !\n"); 
exit(EXIT_FAILURE); 

} 

i = 0; 

chaine = argv[l]; 
while (1) { 

chaine = strstrtchaine, argv[2]); 

if (chaine == NULL) 
break; 

/* on saute la sous-chaine trouvee */ 
chaine += strl en(argv[2] ) ; 
i ++; 

} 

if (i == 0) 

fprintf (stdout, "%s ne se trouve pas dans %s\n", 
argv[2], argv[l]); 

el se 

fprintf (stdout, "%s a ete trouvee %d fois dans £s\n", 
argv[2], i, argv[l]); 

return EXIT_SUCCESS ; 

} 

Voici quelques exemples d' execution : 

$ ./exemple_strstr abcdabcdefgabc abc 

abc a ete trouvee 3 fois dans abcdabcdefgabc 

$ . /exempl e_strstr abcdabcdefgabc abed 

abed a ete trouvee 2 fois dans abcdabcdefgabc 

$ . /exempl e_strstr abcdabcdefgabc abede 

abede a ete trouvee 1 fois dans abcdabcdefgabc 

$ . /exempl e_strstr abcdabcdefgabc abedf 

abedf ne se trouve pas dans abcdabcdefgabc 

$ 

II existe egalement une extension Gnu, nommee strcasestr( ), dont le fonctionnement est le 
meme que celui de strstr( ) mais qui ne fait pas de distinction entre minuscules et majus- 
cules. Elle est egalement sensible a la localisation. Pour creer le programme exempl e_strca- 
sestr.c, on recopie le programme exempl e_strstr.c, en ajoutant une definition _GNU_S0URCE 
avant les inclusions d'en-tetes, pour acceder aux extensions Gnu. On insere egalement une 
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ligne setl ocal e( ) pour tenir compte de la localisation et, bien entendu, on remplace strstr( ) 
par strcasestr( ). Voici F execution qui en resulte : 

$ . /exemple_strcasestr AbcaBcABC abc 

abc a ete trouvee 3 fois dans AbcaBcABC 
$ ./exemple_strcasestr AbcaBcABC abc 
abc ne se trouve pas dans AbcaBcABC 
$ ./exemple_strcasestr AeaE ae 

ae a ete trouvee 2 fois dans AeaE 
$ 

Une autre variante des fonctions de recherche consiste a s'occuper des caracteres appartenant 
a un ensemble donne. Par exemple, la fonction strspn( ), dont le prototype est le suivant 

size_t strspn (const char * chaine, const char * ensemble); 

renvoie la longueur de la sous-chaine initiale constitute uniquement de caracteres compris 
dans l'ensemble fourni en argument. On peut utiliser cette routine pour eliminer les caracteres 
blancs en debut de ligne : 

void 

el imine_bl ancs_en_tete (char * chaine) 
{ 

size_t debut; 
size_t longueur; 

debut = strspn(chaine, " \t\n\r"); 
if (debut != 0) { 

longueur = strlen(chaine + debut); 

memmovet chaine, chaine + debut, longueur + 1); 

/* longueur + 1 pour avoir le caractere nul final */ 




L'ordre des caracteres dans l'ensemble n'a pas d'importance. II existe une fonction inverse, 
strcspn( ), renvoyant la longueur du segment initial ne contenant aucun caractere de l'ensemble 
transmis. Son prototype est equivalent a strspn ( ) : 

size_t strcspn (const char * chaine, const char * ensemble); 

II en existe egalement une variante, strpbrk( ) , qui retourne un pointeur sur le premier carac- 
tere appartenant a l'ensemble : 

char * strpbrk (const char * chaine, const char * ensemble); 

Lorsque cette fonction ne trouve pas de caractere contenu dans l'ensemble indique, elle 
renvoie NULL. Son implementation pourrait etre : 

char * 

strpbrk (const char * chaine, const char * ensemble) 
{ 

size_t longueur; 

longueur = strcspn(chaine, ensemble); 
if (chaine[longueur] == '\0') 
return NULL; 
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return chaine + longueur + 1; 

On peut utiliser cette routine pour eliminer les sauts de ligne et retours chariot en fin de 
chaine, mais egalement pour ignorer tous les commentaires se trouvant a la suite d'un carac- 
tere particulier, comme '#' ou '%' : 

void 

elimine_cominentaires_et_sauts_cle_ligne (char * chaine) 
{ 

char * rejet; 

rejet = strpbrk(chaine, "\n\r#%"); 
if (rejet != NULL) 
rejet[0] = '\0*; 

} 

Analyse lexicale 

Un programme peut parfois avoir besoin d'implementer un petit analyseur lexical. Nous 
insistons sur le mot petit car, des que la complexite d'un tel analyseur augmente, on a interet 
a se tourner vers des outils specialises, comme lex et yacc, dont les versions Gnu sont 
nominees flex et bison. Pour des decompositions lexicales simples, la bibliotheque GlibC 
offre done une fonction nommee strtok( ). Le terme token, qui signifie jeton en anglais, est le 
terme consacre pour designer des elements d' analyse lexicale (par exemple les mots-cles, 
mais aussi les caracteres de synchronisation comme « ; » en langage C). 

La fonction strtok( ) est declaree avec le prototype suivant : 

char * strtok (char * chaine, const char * separateurs) ; 

On passe en premier argument un pointeur sur la chaine a analyser, mais uniquement lors du 
premier appel. Ce pointeur est memorise par strtok( ) dans une variable statique. Lorsqu'on 
rappellera ensuite cette fonction, on lui transmettra un premier argument NULL, a moins de 
vouloir analyser une nouvelle chaine. 

Le second argument est une chaine de caracteres contenant ce qu'on considere comme des 
separateurs. Pour extraire les mots d'une phrase, on pourra ainsi employer une chaine de 
separateurs comme « \t ,;:!?- ». 

Lors de l'appel a strtokt ), cette fonction modifie la chaine transmise a l'origine en premier 
argument. Cette chaine ne doit done pas etre une constante ni une variable statique suscep- 
tible d'etre modifiee par d'autres fonctions de la bibliotheque. Dans de telles situations, il 
convient d'allouer une copie de la chaine, avec strdupO ou strdupaO par exemple, qu'on 
transmettra a strtok( ). 

La fonction strtok( ) renvoie un pointeur sur le premier element lexical, apres avoir elimine 
les eventuels separateurs en debut de chaine. Lors de l'appel suivant, strtokO renvoie un 
pointeur sur le second element lexical, et ainsi de suite jusqu'a la fin de la chaine, ou elle 
renvoie NULL. 

En fait, le fonctionnement de strtok( ) est relativement simple. Elle dispose d'une variable 
statique initialement nulle oil elle stocke le pointeur sur le debut de la chaine. Lors d'une 
invocation, strtok( ) recherche le premier caractere n'appartenant pas a l'ensemble des sepa- 
rateurs en utilisant strspn ( ). Elle memorise ce pointeur, car ce sera la valeur qu'elle renverra. 
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Ensuite elle recherche, en appelant strpbrk( ), le premier caractere qui soit un separateur - 
done le caractere suivant la fin du mot -, puis elle le remplace par un '\0' et stocke le pointeur 
sur l'octet suivant pour reprendre son travail lors de sa future invocation. 

Nous allons ecrire un programme simple qui analyse les champs des lignes transmises sur son 
entree standard, en utilisant les caracteres blancs comme separateurs. 

exemple_strtok.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 

#define LG_MAX I 256 

int 
main (void) 

{ 

char * ligne; 
char * champs; 
int 1 , c; 

if ((ligne = malloc(LG_MAXD) == NULL) { 
perror( "mal 1 oc" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

1 = 1; /* 1 = un */ 

while (fgetsdigne, LG_MAXI, stdin) ! = NULL) { 
fprintf (stdout, "Ligne %d\n" , 1); 
C = 1; 

champs = strtokd igne, " \f); 
while (champs ! = NULL) { 

fprintf (stdout, " champs %d : %s\r\" , c, champs); 

champs = strtok(NULL, " \t"); 

c ++; 

} 

1 ++; 

} 

return EXIT_SUCCESS; 

} 

Nous pouvons utiliser ce programme pour analyser le fichier /etc/fstab par exemple, ou les 
champs sont separes par des tabulations ou des espaces : 

$ ./exemple_strtok < /etc/fstab 

Ligne 1 

champs 1 : /dev/hda5 

champs 2 : / 

champs 3 : ext2 

champs 4 : defaults 

champs 5 : 1 

champs 6 : 1 
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Ligne 2 

champs 1 

champs 2 

champs 3 

champs 4 

champs 5 

champs 6 



/dev/hda6 

swap 

swap 

defaults 

0 

0 



[...] 



Ligne 9 
champs 1 : none 
champs 2 : /proc 
champs 3 : proc 
champs 4 : defaults 
champs 5 : 0 
champs 6 : 0 

$ 

Le fait que strtok( ) garde une variable statique globale entre deux appels le rend non reen- 
trant. En d'autres termes, cette fonction ne doit pas etre utilisee au sein d'un gestionnaire de 
signaux et doit etre evitee dans le cadre d'un programme multithread. Pour pallier ce 
probleme, la bibliotheque GlibC fournit deux fonctions supplementaires oil le pointeur doit 
etre transmis en argument a chaque appel. 

La premiere fonction, strtok_r( ) , est calquee sur strtok( ) avec juste un argument supple - 
mentaire lui permettant d'etre reentrante : 

char * strtok_r (char * chaine, 

const char * separateurs, 
char ** pointeur) ; 

Son fonctionnement est exactement identique a celui de strtok( ), mais il faut done lui fournir 
un pointeur supplementaire, dont on n'a toutefois pas besoin de se soucier specialement. 
Dans notre exemple precedent, il suffisait de modifier le programme en ajoutant une variable 

char * pointeur; 

et d'utiliser les appels 

I champs = strtok_r (ligne, " \t", & pointeur); 
champs = strtok (NULL, " \t", & pointeur); 

Le programme exempl e_strtok_r fonctionne alors exactement comme exempl e_strtok. 

La seconde fonction est strsep( ), qui vient de l'univers BSD. Son prototype est le suivant : 

char * strsep (char ** pointeur, const char * separateur); 

Globalement, elle fonctionne comme strtokO, mais il est du ressort du programmeur 
d'initialiser le pointeur fourni en premier argument pour qu'il soit dirige vers la chaine a 
traiter. 

Cette routine se comporte toutefois differemment lorsqu'elle rencontre plusieurs separateurs 
successivement, puisqu'elle renvoie a ce moment-la une chaine vide alors que strtokO 
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sautait les occurrences successives de separateurs. II faut done ajouter un test supplementaire 
a notre programme, dont la boucle principale devient : 

exemple_strsep.c : 

/* identique a strtok_r.c */ 

while (fgetsdigne, LG_MAXI, stdin) ! = NULL) { 
fprintf (stdout, "Ligne %d\n", 1); 
C = 1; 

pointeur = ligne; 
while (1) { 

champs = strsep(& pointeur, " \t"); 
if (champs == NULL) 

break; 
if (champs[0] == '\0') 
continue; 

fprintf (stdout, " champs %d : %s\r\" , c, champs); 
c ++; 

} 

1 ++; 



return EXIT_SUCCESS; 

} 

L' execution presente bien entendu les memes resultats. 



Conclusion 

Nous achevons ainsi ce chapitre consacre a la gestion des chaines de caracteres et des blocs de 
memoire. Nous y avons etudie en detail les routines classiques de traitement des chaines 
de caracteres. 

Nous avons ainsi vu quelques possibilites d' analyses lexicales simples. Pour construire un 
veritable analyseur complet, on se penchera plutot sur des outils specialises comme f 1 ex et 
bi son, dont on trouvera une description detaillee dans [Levine 1994] lex & yacc. 

Le prochain chapitre presentera des traitements plus complexes, comme les expressions regu- 
lieres, ou le cryptage de donnees. 



16 



Routines avancees de traitement 

des blocs memoire 



Nous avons deja observe dans le chapitre precedent un grand nombre de routines permettant 
d'accomplir les taches les plus courantes du traitement de blocs ou de chaines de caracteres. 

Nous allons analyser ici deux types de traitements plus rares, mais egalement precieux : les 
expressions rationnelles, qui permettent de rendre une manipulation de chaines beaucoup plus 
generaliste, et les techniques de cryptage plus ou moins elaborees des blocs de donnees. 

Utilisation des expressions rationnelles 

Ce qu'on appelle expression rationnelle (regular expression en anglais, parfois traduit par 
expression reguliere) est en fait un motif contenant par exemple des caracteres generiques 
(comme '*' ou '?' dans les commandes du shell), qu'on peut mettre en correspondance avec 
des chaines de caracteres precises. La syntaxe des expressions rationnelles peut etre tres 
compliquee, en gerant des repetitions, des OU logiques, etc. 

La bibliotheque C nous offre des fonctions permettant de verifier si une chaine donnee corres- 
pond a un motif ou non. Les applications de ce principe sont nombreuses, de la recherche de 
noms de fichiers (/usr/include/*.h) a 1' extraction d'une chaine particuliere dans un fichier 
de texte (comme avec grep). 

Une bonne partie des applications courantes conservent, sous une forme ou une autre, une 
liste d'objets qu'elles manipulent. Ces objets sont souvent etiquetes a destination de l'utilisa- 
teur. Offrir a celui-ci la possibility d'afficher, de selectionner et de rechercher tous les objets 
dont le nom correspond a un motif donne peut ameliorer sensiblement les performances 
d'une application. 

Nous traiterons des fonctions permettant specifiquement de rechercher les fichiers dont le 
nom correspond a un certain motif dans le chapitre consacre aux acces aux repertoires. 
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Les fonctions generiques de traitement des expressions rationnelles sont declarees dans le 
fichier <regex.h>. Certaines de ces fonctions sont definies par SUSv3 (ayant ete introduite 
auparavant par Posix.2), d'autres sont bien plus anciennes et specifiques aux applications 
Gnu. Si on desire utiliser uniquement les fonctionnalites portables, il suffit de definir la 
constante _P0SIX_S0URCE avant l'inclusion. 

II est difficile de donner une definition des expressions rationnelles sans entrer dans une 
description formelle et rebarbative. Aussi, nous laisserons le lecteur se reporter a la page de 
manuel regex(7) qui, a defaut d'etre un modele de clarte, presente Favantage d'une exhausti- 
vite quasi totale. On peut aussi examiner la documentation de l'utilitaire grep, qui est proba- 
blement le programme le plus populaire pour manipuler les expressions rationnelles. 

Heureusement pour nous, le programmeur n'a aucunement besoin de connaitre en detail la 
syntaxe des expressions rationnelles, puisque justement la bibliotheque C nous offre une 
interface avec ce format. Seul Futilisateur final devra se pencher sur les arcanes de ces expres- 
sions. En fait, le programmeur devra s'y interesser un minimum, ne serait-ce que pour rediger 
la documentation de son application, mais nous echapperons a la description detaillee et 
formelle des expressions rationnelles. En fait, nous allons a la fin de ce paragraphe fournir un 
programme generaliste detaillant chaque option des routines a utiliser, mais sans avoir besoin 
de decrire precisement les mecanismes syntaxiques mis en ceuvre. 

Le principe adopte pour mettre en correspondance une chaine avec un motif donne consiste 
en une premiere etape de compilation de l'expression rationnelle. Cette compilation permet 
de creer une representation interne de l'expression afin de rendre possible une comparaison 
rapide par la suite. Le detail de la compilation n'est pas specifie, il s'agit d'un choix d'imple- 
mentation de la bibliotheque C. La fonction de compilation est regcomp( ), dont le prototype est : 

int regcomp (regex_t * motif_compile, const char * motif, int attributs); 

Cette fonction prend en deuxieme argument une chaine de caracteres contenant le motif a 
compiler, et remplit une structure de donnees opaque, de type regex_t, qu'on passe en premier 
argument. On pourra ensuite utiliser le motif compile represente par la structure de type 
regex_t pour verifier rapidement la correspondance avec une chaine donnee. 

Le troisieme argument peut contenir un ou plusieurs attributs, represented par des constantes 
symboliques qu'on associe avec un OU binaire : 



Constante 


Signification 


REG_ 


.EXTENDED 


Le motif doit etre considere comme une expression rationnelle au format etendu. Ceci correspond 
a I'option -E de grep. Dans les expressions rationnelles etendues, les caracteres ?,+,{, | , (, et ) 
ont une signification speciale, alors que dans les expressions simples, il faut les prefixer avec « \ >> 
pour obtenir le meme comportement. 


REG_ 


.ICASE 


Ignorer les differences entre minuscules et majuscules lors de la mise en correspondance. 


REG_ 


.NOSUB 


On ne desire pas conserver le contenu des sous-expressions mises en correspondance. Dans ce 
cas, on s'interesse uniquement a la correspondance ou non d'un motif avec une chaine, sans avoir 
besoin de savoir comment les sous-expressions sont remplies. Nous detaillerons ce mecanisme 
un peu plus loin. 


REG_ 


.NEWLINE 


Le caractere de saut de ligne rencontre dans une chaine ne sera pas considere comme un carac- 
tere ordinaire, mais prendra sa signification normale. En consequence, les caracteres speciaux $ 
et A contenus dans un motif pourront etre mis en correspondance respectivement avec les parties 
suivant et precedant le saut de ligne. Le caractere « . » ne peut plus correspondre au saut de ligne. 
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Lorsque la compilation reussit, regcomp( ) renvoie 0. Sinon elle renvoie une valeur d'erreur 
qu'on peut transmettre a la fonction regerror( ) dont le prototype est le suivant : 

size_t regerror (int erreur, regex_t * motif_coinpile. 



Cette fonction analyse le code d'erreur passe en premier argument, ainsi que le pointeur sur le 
motif compile (ou plutot sur le motif dont la compilation a echoue) rempli par regcomp( ). Elle 
en deduit un message d'erreur - malheureusement ne prenant pas encore en compte la locali- 
sation - dont elle copie, dans la chaine passee en troisieme argument, le nombre d'octets 
indique en dernier argument, caractere nul final compris. Si le message d'erreur n'a pas pu 
etre copie en entier, il est tronque. La fonction regerror( ) renvoie le nombre d'octets neces- 
saires pour stocker le message d'erreur, caractere nul compris. II est done possible de l'invo- 
quer en deux passes, la premiere pour determiner la longueur a allouer avec un libelle valant 
NULL et une taille maximale a zero, la seconde pour remplir le message. 

Lorsqu'on n'a pas precise l'option REG_N0SUB, la bibliotheque C nous fournit des details sur 
les correspondances effectuees, sans se contenter de nous dire si les chaines concordent. Ces 
informations sont stockees dans des structures de type regmatch_t, qu'il faut allouer avant la 
verification. Au sein de ces structures, deux champs nous permettent de savoir quelle portion 
de la chaine correspond a chaque sous-expression. 

Le nombre de sous-expressions detectees est fourni dans le champ re_nsub du motif compile, 
de type regex_t, apres la reussite de regcomp( ). Toutefois, il faut allouer un element de plus, 
car la fonction de comparaison nous indique aussi la portion de chaine correspondant a 
l'expression complete. 

Une fois que la compilation est terminee, qu'on a alloue eventuellement un tableau de struc- 
tures regmatch_t de la taille indiquee par le champ re_nsub+l, on peut appeler la fonction de 
comparaison regexec( ). Celle-ci a le prototype suivant : 

I int regexec (regex_t * motif_coiripile, char * chaine, 



Cette fonction compare la chaine et le motif compile, et renvoie zero s'ils concordent. Sinon, 
elle renvoie une valeur pouvant etre : 

• REGJOMATCH : pas de correspondance. 

• REG_ESPACE : pas assez de memoire pour traiter l'expression compilee. Ceci peut se produire 
a cause de recurrence dans les sous-expressions. Ce cas est tres rare et doit quasiment etre 
considere comme une erreur fatale. 

Lorsque la mise en correspondance reussit, regexec( )remplit nb_sous_expr elements du 
tableau sous_expr[] avec les informations permettant de savoir quelles portions de la chaine 
correspondent aux sous-expressions entre parentheses du motif. 

Les elements du tableau sous_expr[]sont de structures regmatch_t, possedant deux champs 
qui nous interessent : 

• rm_so correspond a la position du premier caractere de la portion de chaine mis en corres- 



• rm_eo correspond a la position de la fin de la portion de chaine mis en correspondance. 



char * libelle, size_t taillejaxi ); 



size_t nb_sous_expr, regmatch_t sous_expr [], int attribut); 



pondance. 
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Le premier element (d'indice 0) dans le tableau sous_expr[] correspond en fait a la portion 
equivalant a l'expression complete. Les elements suivants concernent les sous-expressions 
successives. 

Le dernier argument de regexecO contient un attribut constitute d'un OU binaire entre les 
constantes suivantes : 

• REG_N0TB0L : ne pas considerer le debut de la chaine comme un debut de ligne. Le caractere 
special $ ne s'appliquera done pas a cet endroit. 

• REG_N0TE0L : ne pas considerer la fin de la chaine comme une fin de ligne. Le caractere 
special A ne s'y appliquera done pas. 

Enfin, une fois qu'on a termine de traiter une expression rationnelle, il faut bien entendu 
liberer la table des sous-expressions qu'on a allouee, mais il faut egalement invoquer la fonc- 
tion regf ree( ) en lui passant en argument le pointeur sur le motif compile. Cela permet a la 
bibliotheque de liberer toutes les donnees qu'elle a allouees dans cette structure lors de la 
compilation. Bien sur, ces liberations ne sont importantes que si on souhaite a nouveau 
compiler une autre expression reguliere, mais e'est quand meme une bonne habitude a 
prendre pour eviter les fuites de me moire. 

Nous allons ecrire un programme qui prend en argument une expression rationnelle, et qui 
tente de la mettre en correspondance avec les lignes qu'il lira successivement sur son entree 
standard. De plus, ce programme acceptera un certain nombre d' options, qui seront trans- 
mises dans les attributs des fonctions regcomp( ) et regexec( ). Ces options sont : 



Option 




Argument equivalent 


Fonctlon concernee 




-e 


REG. 


.EXTENDED 


regcompt ) 




-i 


REG. 


.ICASE 


regcomp( ) 




-s 


REG. 


.NOSUB 


regcomp( ) 




-n 


REG. 


.NEWLINE 


regcomp( ) 




-d 


REG. 


.NOTBOL 


regexec( ) 




-f 


REG. 


.NOTEOL 


regexec( ) 





Lorsque la correspondance reussit, le programme affiche les expressions et sous-expressions 
reconnues. Nous traitons toutes les fonctions decrites ci-dessus. 

exemple_regcomp.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <regex.h> 

void 

aff i che_syntaxe (char * nom_prog) 
{ 

fprintf (stderr, "Syntaxe : %s [options] motif\n", nom_prog); 
fprintf (stderr, " Options :\n"); 
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fprintf (stderr, " -e 

fprintf (stderr, " -i 

fprintf (stderr, " -s 

fprintf (stderr, " -n 

fprintf (stderr, " -d 

fprintf (stderr, " -f 



expressions rationnelles etendues \n"); 

pas de differences majuscule/minuscule \n"); 

ne pas memoriser les sous-expressions \n"); 

gerer les sauts de lignes \n"); 

debut de chaine sans saut de ligne \n"); 

fin de chaine sans saut de ligne \n"); 



#define LG_MAXI 256 



int 

main (int argc, char 



argv []) 



int option; 

char * 1 iste_options = "eisndf" 

int option_regcomp = 0; 

int option_regexec = 0; 

regex_t motif_compile; 

int erreur; 

char * message_erreur; 

size_t lg_message; 

size_t nb_sous_chaines = 0; 

regmatch_t * sous_chaines = NULL; 

char 1 1gne[LG_MAXI] ; 

char sous_chaine[LG_MAXI] ; 

size_t lg_sous_chaine; 

int i ; 



opterr = 0; /* pas de message d'erreur de getoptO */ 
while ((option = getopt(argc. argv, 1 iste_options) ) != 
switch (option) { 
case 'e' : 

option_regcomp |= REG_EXTENDED; 

break; 
case 'i' : 

option_regcomp |= REG_ICASE; 

break; 
case 's' : 

option_regcomp |= REG_N0SUB; 

break; 
case 'n' : 

option_regcomp |= REG_NEWLINE; 

break; 
case 'd' : 

option_regexec |= REG_NOTB0L; 

break; 
case 'f : 

option_regexec |= REG_NOTE0L; 

break; 
case '?' : 

affiche_syntaxe (argv [0]); 



-1 H 
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exit (1); 

} 

} 

if (argc - optind != 1) { 
/* il manque le motif */ 
aff i che_syntaxe(argv[0] ) ; 
exit(EXIT_FAILURE); 

} 

erreur = regcomp(& motif_compile, argv[argc - 1], option_regcomp) ; 
if (erreur != 0) { 

lg_message = regerror(erreur, & motif_compile, NULL, 0); 
message_erreur = mal 1 oc(l g_message) ; 
if (message_erreur == NULL) { 
perror( "mal 1 oc" ) ; 
exit(EXIT_FAILURE); 

} 

regerrorterreur, & motif_compile, message_erreur, lg_message); 
fprintf (stderr, "£s\n", message_erreur) ; 
f ree(message_erreur) ; 
exit(EXIT_FAILURE); 

} 

if ((option_regcomp & REG_N0SUB) == 0) { 

nb_sous_chaines = motif_compile.re_nsub + 1; 
sous_chaines = calloc(nb_sous_chaines, 

sizeof ( regmatch_t) ) ; 

if (sous_chaines == NULL) { 
perrort "cal 1 oc" ) ; 
exit(EXIT_FAILURE); 

} 

} 

while (fgetsdigne, LG_MAXI , stdin) ! = NULL) { 

erreur = regexec(& motif_compile, ligne, nb_sous_chaines, 

sous_chaines, option_regexec) ; 
if (erreur == REG_N0MATCH) { 

fprintf (stdout, "Pas de correspondance \n"); 
continue; 

} 

if (erreur == REG_ESPACE) { 

fprintf (stderr, "Pas assez de memoire \n"); 
exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Correspondance 0k\n"); 
if ((option_regcomp & REG_N0SUB) != 0) 
continue; 

for (i =0; i < nb_sous_chaines ; i ++) ( 
lg_sous_chaine = sous_chaines[i].rm_eo 
- sous_chaines[i].rm_so; 
strncpy(sous_chaine, 

ligne + sous_chaines[i].rm_so, 
lg_sous_chaine); 
sous_chaine[lg_sous_chaine] = '\0'; 
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if (i == 0) 

fprintf (stdout, "expression : %s\n", 
sous_chaine) ; 

el se 

fprintf (stdout, "ss-expr M2d : %s\n" 
i, sous_chaine) ; 



/* Ces liberations seraient indispensables si on voulait 
* compiler un nouveau motif 
*/ 

free(sous_chaines) ; 
sous_chaines = NULL; 
nb_sous_chaines = 0; 
regfree(& motif_compile) ; 
return EXIT_SUCCESS; 



( 



Voici quelques exemples d' execution, mais nous encourageons le lecteur a experimenter lui- 
meme les differentes options des routines regcomp( ) et regexec( ). 

$ ./exemple_regcomp "a\(b*\)c\(de\)" 

abcdefg 

Correspondance Ok 
expression : abode 
ss-expr 01 : b 
ss-expr 02 : de 
acdef 

Correspondance Ok 
expression : acde 
ss-expr 01 : 
ss-expr 02 : de 
abbbbcdefg 
Correspondance 0k 
expression : abbbbcde 
ss-expr 01 : bbbb 
ss-expr 02 : de 
acdf 

Pas de correspondance 
$ 

Rappelons que dans les expression rationnelles '*' signifie « zero ou plusieurs repetitions du 
caractere precedent » et n'a done pas son sens habituel avec le shell. Verifions la non-diffe- 
renciation majuscules / minuscules : 



$ ./exemple_regcomp 

ABBBCDEF 

Correspondance 0k 



■i "a\(b*\)c\(de\)" 



expressi on 
ss-expr 01 
ss-expr 02 



ABBBCDE 



DE 
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Avec Foption REG_N0SUB, on ne veut pas savoir comment la mise en correspondance se fait, 
mais juste avoir un resultat Vrai ou Faux : 

$ ./exemple_regcomp -s "a\(b*\)c\(de\)" 

abcdefg 

Correspondance Ok 

Voyons un message d'erreur transmis par regerror( ) lors d'une erreur de compilation : 

$ ./exemple_regcomp "a\(b*\)c\(de" 

Unmatched ( or \( 

Enfin, avec l'option REG_EXTENDED, les expressions rationnelles sont etendues, ce qui signifie 
que les metacaracteres prennent leur signification sans avoir besoin d'etre precedes de 'V : 

$ . /exemple_regcomp -e "a(b*)c(de)" 

abbcdeff 

Correspondance Ok 
expression : abbcde 
ss-expr 01 : bb 
ss-expr 02 : de 
$ 

Nous voyons que ces fonctions sont tres puissantes puisqu'elles facilitent Faeces a des perfor- 
mances ameliorees pour une application, sans necessiter de developpement complexe. Ces 
fonctionnalites sont en fait une extension naturelle des comparaisons de chaines qu'on a pu 
etudier precedemment. 

II existe un equivalent BSD quasi obsolete puisqu'il utilise une zone de memoire statique 
pour memoriser le motif compile. Cet ensemble est constitue par les routines re_comp( ) et 
re_exec(), declarees dans <re_cotnp.h> : 

j char * re_comp (const char * motif); 
int re_exec (const char * chaine); 

Ces fonctions n'etant pas utilisables dans un environnement multi thread par exemple, il vaut 
mieux les eviter dorenavant. 



Cryptage de donnees 

Pour terminer cet ensemble de chapitres traitant de la manipulation des blocs de memoire et 
des chaines, nous allons consacrer un moment aux routines permettant le cryptage plus ou 
moins complexe de donnees. 

Cryptage elementaire 

Fout d'abord, notons rapidement Fexistence de la fonction strf ry( ) : 

char * strfry (char * chaine); 

Cette fonction est une extension Gnu qui utilise le generateur aleatoire rand( ) pour modifier 
la chaine transmise et en creer un anagramme. Elle renvoie ensuite un pointeur sur cette 
meme chaine. F'utilite d'une telle fonction ne me saute pas vraiment aux yeux. Peut-etre pour 
creer automatiquement des mots de passe ou des jeux de lettres ? 
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exemple_strfry.c : 

#define _GNU_SOURCE 
#include <stdio.h> 
#include <string.h> 

int 

main (int argc, char * argv[]) 
{ 

char * chaine; 

if (argc ! = 2) { 

fprintf (stderr, "Syntaxe : %s chaine \n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

chaine = strdup(argv[l]) ; 
strfry(chaine) ; 

fprintf (stdout, "£s\n", chaine); 
return EXIT_SUCCESS; 

} 

$ ./exemple_strfry linux 
i nxl u 

$ ./exemple_strfry linux 

nl i ux 

$ ./exemple_strfry linux 
uxl i n 

$ ./exemple_strfry linux 

nl ixu 

$ ./exemple_strfry linux 

xul ni 

$ 

memfrobO peut etre une fonction un petit peu plus utile. Cette extension Gnu dispose du 
prototype suivant : 

void * memfrob (void * bloc, size_t taille); 

Elle parcourt le bloc indique et effectue un OU EXCLUSIF binaire octet par octet avec la 
valeur magique 42 (en hommage, je suppose, a Douglas Adams). Bien sur, lorsqu'on repasse 
la fonction une seconde fois sur le bloc, on retrouve exactement les donnees d'origine. 

L'interet de cette routine est de dissimuler grossierement des blocs de texte qu'on pourrait 
sinon trouver dans le fichier executable (par exemple, les listes de mots-cles et de commen- 
taires dans un jeu d'aventure). L'idee est finalement un peu la meme que pour le codage ROT- 
13 dans les groupes Usenet, oil on dissimule par exemple la solution d'une devinette ou des 
revelations sur un feuilleton pour que le lecteur fasse la demarche volontaire de decoder et 
lire le texte. 
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Cryptage simple et mots de passe 

La fonction de cryptage la plus simple disponible dans la bibliotheque C se nomme crypto. 
Elle est utilisee pour la transformation des mots de passe. Son prototype est declare dans 
<crypt . h> : 

char * crypt (const char * mot_passe, const char * prefixe); 

Elle prend deux chaines de caracteres : le mot de passe lui-meme, et un prefixe que nous 
preciserons ci-dessous. Elle renvoie une chaine de caracteres, allouee de maniere statique, 
contenant le mot de passe crypte. 

Le principe des mots de passe sous Unix consiste a utiliser un algorithme non reversible, 
transformant la chaine claire en une bouillie illisible, mais refletant le mot de passe initial. 
Lors d'une tentative de connexion, le mot de passe saisi est lui aussi passe dans cet algorithme 
de cryptage et les deux bouillies sont alors comparees. Si elles sont egales, la connexion est 
acceptee. Cette methode permet de ne conserver sur le systeme que des mots de passe deja 
cryptes par l'intermediaire d'un algorithme dont on ne connait pas de fonction inverse. 

La seule maniere theorique d'attaquer le systeme est alors de se procurer un dictionnaire, de 
passer tous les mots dans la moulinette de cryptage, et de comparer les mots de passe cryptes 
avec chacun des resultats du dictionnaire. Cela pourrait etre facilement executable, sans le 
prefixe qu'on ajoute. Ce prefixe a deux roles. Tout d'abord, il permet de selectionner entre 
deux types de cryptage, MD5 ou DES, et il sert ensuite a perturber le cryptage. On veut eviter 
qu'un pirate puisse une fois pour toutes chiffrer a Favance tout le dictionnaire et comparer les 
resultats avec les mots de passe cryptes. L introduction d'un prefixe occupant au minimum 
deux caracteres alphanumeriques l'obligerait a crypter au minimum 4 096 dictionnaires. En 
fait, de plus en plus, le prefixe contiendrait plutot 8 caracteres imprimables aleatoires, ce qui 
necessiterait de preparer 64 8 , c'est-a-dire 2 48 , ou encore 200 000 milliards de dictionnaires. 

De plus, sur les distributions Linux recentes, ce mecanisme est encore renforce par l'utilisa- 
tion des shadow passwords, grace auxquels la liste des mots de passe cryptes n'est plus acces- 
sible a tous, mais uniquement a root. 

Le cryptage utilisant MD5 est preferable a celui utilisant DES car il s'agit reellement d'une 
fonction a sens unique, ne permettant en aucun cas de retrouver le mot original a partir de la 
version cryptee. L'algorithme de cryptage MD5 est decrit en detail dans la RFC 1321, datant 
d'avril 1992. Ce document presente non seulement l'algorithme mais aussi des exemples de 
code d' implementation. Pour utiliser le cryptage MD5, le prefixe a fournir doit obligatoire- 
ment commencer par les caracteres « $ 1 $ ». Ensuite, on trouve jusqu' a 8 caracteres, de prefe- 
rence aleatoires, choisis dans l'ensemble constitue des chiffres '0' a '9', des lettres 'A' a 'Z' et 
'a' a 'z', ainsi que des caracteres '.' et '/'. On peut eventuellement ajouter un '$' a la fin du 
prefixe. Sinon, la fonction crypt( ) le rajoutera elle-meme. 

Pour utiliser le cryptage DES, on fournit un prefixe constitue de deux caracteres seulement, 
pris dans l'ensemble decrit plus haut. Ce cryptage necessite egalement que la bibliotheque 
GlibC ait ete compilee avec un complement particulier. Si ce n'est pas le cas, lors de l'execu- 
tion du programme, la fonction crypt( ) renvoie une chaine vide, et la variable globale errno 
contient le code EOPNOTSUPP. 

La chaine renvoyee par crypt ( ) contient done le prefixe fourni, intact, eventuellement complete 
d'un '$' pour le MD5, suivi de la « bouillie » correspondant au cryptage du mot de passe. 



Routines avancees de traitement des blocs memoire 

Chapitre 16 



Lors de Femploi de la fonction crypt ( ) sur un systeme acceptant le mecanisme DES, il faut 
utiliser la bibliotheque libcrypt.so au moment de F edition des liens en ajoutant l'option - 
1 crypt sur la ligne de commande du compilateur. 

Notre premier exemple va consister a crypter le mot de passe et le prefixe passes en arguments 
sur la ligne de commande, et a afficher le resultat (tel qu'on pourrait le trouver dans un fichier 
/etc/passwd ou /etc/shadow). 

exemple_crypt.c : 

#include <stdio.h> 
#include <unistd.h> 
#include <crypt.h> 

int 

main (int argc, char * argv[]) 
{ 

if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s mot_passe prefixe \n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

fprintf (stdout, "£s\n", crypt(argv[l] , argv[2])); 
exi t(EXIT_FAI LURE); 

} 

Nous utilisons un prefixe arbitraire, qui aurait du normalement etre choisi aleatoirement. 
Nous creons un cryptage MD5, puis un cryptage DES. 

$ cc -Wall -g exemple_crypt.c -o exemple_crypt -lcrypt 
$ ./exemple_crypt linux2.2 \$l\$abcdefgh\$ 

$l$abcdefgh$rpJWA.91TJXFSyEm/t80Pl 
$ ./exemple_crypt linux2.2 ab 
ab74RL2dilGZ. 
$ 

Nous protegeons du shell le caractere '$' en le faisant preceder d'un '\'. 

Notre second exemple va consister a verifier si le mot de passe transmis en premier argument 
correspond bien au cryptage fourni en second argument. Nous pouvons directement passer a 
la fonction crypt ( )le mot de passe crypte en guise de prefixe, elle ne prendra en consideration 
que les caracteres qui la concernent. 

exemple_crypt 2.c : 

#include <stdio.h> 

#include <string.h> 

#include <unistd.h> 

#include <crypt.h> 

int 

main (int argc, char * argv[]) 

{ 

char * cryptage; 
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if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s mot_passe bouillie \n", argv[0]); 
exit(EXIT_FAILURE); 

} 

cryptage = crypt(argv[l] , argv[2]); 
if (strcasecmp(cryptage, argv[2]) == 0) 
fprintf (stdout, "Verification 0k\n"); 

el se 

fprintf (stdout, "Mauvais mot de passe \n"); 
exit(EXIT_SUCCESS); 

} 

Nous allons verifier un cryptage MD5 et un DES provenant de l'exemple precedent, puis nous 
modifierons le dernier caractere du mot de passe crypte afin de faire echouer la comparaison. 

$ ./exemple_crypt_2 linux2.2 \$l\$abcdefgh\$rpJWA.91TJXFSyEm/t80Pl 

Verification Ok 

$ ./exemple_crypt_2 linux2.2 ab74RL2dilGZ. 

Verification Ok 

$ ./exemple_crypt_2 linux2.2 \$l\$abcdefgh\$rpJWA.91TJXFSyEm/t80P2 

Mauvais mot de passe 
$ 

La fonction crypt( ) . utilisant une chaine de caracteres statique pour renvoyer son resultat, 
n'est pas utilisable dans un environnement multithread ou au sein d'un gestionnaire de signaux. 
Pour pallier ce probleme, la GlibC offre une extension Gnu nommee crypt_r( ), dont le proto- 
type est le suivant : 

char * crypt_r (const char * mot_de_passe, const char * prefixe, 
struct crypt_data * cryptage); 

Le dernier argument est un pointeur sur une structure contenant suffisamment de place pour 
stocker le mot de passe crypte. Avant d'appeler cette routine, il faut mettre a zero le champ 
i ni ti al i zed de cette structure ainsi : 

struct crypt_data cryptage; 
cryptage . initialized = 0; 

resultat = crypt_r(mot_passe, prefixe, & cryptage); 

On notera bien que la fonction crypt( ) ne peut servir qu'a un cryptage de mot de passe. La 
fonction n'etant pas reversible, on ne peut pas recuperer les donnee initiales. 

Cryptage de blocs de memoire avec DES 

La bibliotheque GlibC offre la possibility de chiffrer des blocs de memoire en utilisant l'algo- 
rithme DES. Ce systeme, mis au point par IBM dans les annees soixante-dix, fonctionne sur 
le principe d'une cle privee. II a ete decrit dans le document FIPS 46-1, publie en 1988 par le 
gouvernement americain, et est equivalent a l'algorithme decrit sous le nom DEA Ansi 
X3.92-1981. 

DES fonctionne en cryptant des blocs de donnees de 64 bits en utilisant une cle longue de 
56 bits. Cette cle comportant des bits de parite, elle s'etend egalement sur une longueur totale 
de 64 bits. 
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II n'est pas question de construire une veritable application cryptographique en utilisant ces 
fonctions. Tout d'abord, DES se servant d'un systeme de cle privee, il est necessaire de 
disposer d'un canal de communication sur pour transmettre la cle de decodage a son interlo- 
cuteur, ce qui est souvent aussi complique que d'envoyer tout le message de maniere secu- 
risee. De plus, DES fonctionne avec des cles de 56 bits, et il est probable que la plupart des 
services secrets disposent d'ores et deja de machines capables de decrypter un message en 
employant la force brute (essayer toutes les cles possibles jusqu'a obtention d'un texte 
lisible), et ceci dans un temps raisonnable. Ce systeme cryptographique repose en effet sur 
l'idee qu'un decodage par force brute necessite un investissement informatique et un temps 
de calcul redhibitoires. Bien entendu, la validite de ces deux parametres est difficile a estimer, 
et de gros centres de calcul disposent de « casseurs de DES » exploitables. 

Pour eviter ces desagrements, on emploiera dans des applications cryptographiques des 
bibliotheques fonctionnant avec d'autres systemes plus stirs (RSA par exemple). On peut 
aussi employer directement un logiciel specialise comme PGP (Pretty Good Privacy), dont la 
renommee n'est plus a faire, ou mieux, son homologue libre GPG (Gnu Privacy Guard), qui 
offre l'avantage d' avoir ete developpe en Allemagne, et n'est done pas soumis aux restrictions 
d'utilisation hors des Etats-Unis qui compliquent tant la mise en service de PGP. Si on desire 
integrer des appels a GPG ou a PGP depuis le corps d'une application (pour authentifier un 
message par exemple), on se reportera au document RFC 2440 qui decrit le standard Open- 
PGP a utiliser. 

Tout en etant conscient de toutes les limitations de securite inherentes a l'emploi de DES, 
nous pouvons toutefois vouloir l'employer dans une application pour, par exemple, crypter le 
contenu d'un fichier de donnees dans une application comptable, masquer l'identite des 
patients dans les dossiers d'un systeme d'aide au diagnostic medical, ou encore dissimuler le 
contenu d'une application d' agenda electronique. 

En fait, de par sa nature de systeme a cle privee, DES est surtout utilisable dans des environ- 
nements oil le meme utilisateur cryptera et decryptera les donnees. Son interet principal 
reside dans le verrouillage de fichiers qui restent ainsi illisibles, meme pour l'administrateur 
root. DES est peu recommande lorsque les donnees doivent etre transmises a un correspon- 
dant, a cause du probleme pose par la communication de la cle. 

Comme nous l'avons deja explique, l'algorithme DES utilise une cle privee de 64 bits et 
chiffre un bloc de 64 bits pour produire un nouveau bloc de 64 bits. II existe dans la biblio- 
theque GlibC des fonctions de bas niveau, setkey ( ), encrypt( ) , setkey_r( ) et encrypt_r( ) , 
dont l'utilisation est particulierement penible car elles manipulent les blocs de 64 bits sous 
forme de tables de 64 caracteres, chaque caractere representant un seul bit a la fois. 

Heureusement, il existe deux fonctions de plus haut niveau qui nous simplifient le travail, 
ecb_crypt( ) et cbc_crypt( ). ECB signifie Electronic Code Book et CBC, Cipher Block Chai- 
ning. II s'agit de modes operatoires differents pour la normalisation de DES. Ces fonctions 
servent toutes deux a chiffrer ou a dechiffrer un bloc, mais cbc_crypt( ) assure un niveau de 
plus de chiffrage. Cette fonction effectue en effet un OU EXCLUSIF sur les blocs avant de les 
chiffrer, en changeant la valeur a chaque bloc. II existe done une chaine de 8 octets supple- 
mentaires a conserver avec les donnees, mais l'algorithme est beaucoup moins sensible a une 
cryptanalyse si plusieurs blocs originaux sont semblables. 

La fonction ecb_crypt( ) est declaree dans <rpc/des_c ry pt . h> ainsi : 

int ecb_crypt (char * cle, char * bloc, unsigned longueur, unsigned mode) 
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La cle est transmise en premier argument sous forme de bloc de 8 octets. Les bits de parite de 
la cle doivent etre positionnes correctement. Ceci est assure par une fonction supplementaire 
que nous verrons plus bas. La fonction chiffre ou dechiffre les blocs situes a partir de 
l'adresse transmise en second argument, jusqu'a la longueur indiquee. Cette longueur doit 
etre un multiple de 8. Les blocs chiffres remplacent les blocs originaux. 

Le mode indique en dernier argument est constitue par un OU binaire entre les constantes 
symboliques suivantes : 



Constante 


Signification 


DES_ENCRYPT 


On desire crypter les donnees. 


DES_DECRYPT 


On desire decrypter les donnees. Bien entendu, une seule de ces deux constantes doit etre 
indiquee. 


DESJW 


Essayer d'utiliser un coprocesseur de chiffrement DES s'il en existe un sur la machine. 
Ceci peut ameliorer sensiblement la vitesse du cryptage. Si aucun coprocesseur n'est 
disponible, le chiffrement sera fait de maniere logicielle. 


DES_SW 


Ne pas utiliser de coprocesseur de cryptage, meme s'il en existe un sur le systeme. Cette 
option peut servir a garantir que les donnees ne pourront pas etre interceptees avec un 
coprocesseur truque installe par un administrateur peu scrupuleux. 


En retour, ecb_crypt( ) renvoie l'une des constantes symboliques suivantes : 


Code 


Signification 


DESERR_NONE 


Cryptage reussi. 


DESERR_NOHWDEVICE 


Cryptage reussi de maniere logicielle, pas de coprocesseur disponible. 


DESERRJWERROR 


Echec de cryptage du au coprocesseur ou a I'absence du supplement « crypt » lors de la 
compilation de la bibliotheque C. 


DESERR_BADPARAM 


Echec de cryptage du a de mauvais parametres, notamment si la longueur indiquee n'est 
pas un multiple de 8. 



Pour eviter d' avoir a tester plusieurs cas, la macro DES_FAILED(int erreur) prend une valeur 
non nulle si l'erreur est l'une des deux dernieres constantes symboliques. 

Le fonctionnement de cbc_crypt( ) est exactement le meme, mais avec un argument supple- 
mentaire : 

int cbc_crypt (char * cle, char * bloc, unsigned longueur, 
unsigned mode, char * vecteur); 

Le vecteur est un bloc de 8 octets qui sera associe par un OU EXCLUSIF au premier bloc 
avant son chiffrement. Ensuite, le premier bloc crypte est utilise a nouveau dans un OU 
EXCLUSIF avec le second bloc avant son chiffrement, et ainsi de suite. Le phenomene 
inverse a lieu lors du decryptage des blocs. On emploie sou vent un bloc compose de 8 octets 
choisis aleatoirement en guise de vecteur initial. II faut alors conserver ce vecteur avec les 
donnees cryptees, afin de pouvoir les decoder. Une autre solution consiste a utiliser une valeur 
constante, par exemple 8 octets a zero, mais a employer un premier bloc rempli aleatoire- 
ment. Bien entendu, ces deux methodes sont equivalentes, mais dans la seconde, le vecteur 
aleatoire fait partie integrante des donnees cryptees. 
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Nous avons indique que la cle de chiffrage devait disposer de bits de parite correctement posi- 
tionnes. Pour cela, il existe une fonction d'aide, des_setpari ty( ) , dont le prototype est : 

void des_setparity (char * cle); 

On transmet a cette fonction la cle qui nous a ete donnee par l'utilisateur par exemple, et elle 
s'occupe de placer comme il le faut les 8 bits de parite en fonction des 56 bits efficaces de la 
cle. Les parites sont representees par les bits de poids faibles de chaque octet. 

L' exemple que nous allons presenter ici utilisera la fonction ecb_crypt( ) pour ne pas compli- 
quer inutilement le code avec la gestion du vecteur initial. Le programme que nous allons 
creer sera appele de deux manieres differentes, avec l'aide d'un lien symbolique. II etudiera 
son argument numero 0 pour savoir s'il a ete invoque sous le nom des_crypte ou des_ 
decrypte, et adaptera alors l'argument mode de ecb_crypt( ). 

Notre programme prend n'importe quelle cle passee sur la ligne de commande, en la limitant 
a 8 caracteres. Nous savons que strncpy( ) completera la cle avec des zeros si elle a moins de 
8 caracteres. Nous ne recommandons pas Futilisation directe de la cle fournie par l'utilisa- 
teur, car les cles saisies par un etre humain restent dans le domaine des caracteres imprima- 
bles et ont une entropie bien plus faible qu'un choix aleatoire dans l'espace allant de 0 a 255. 
Pour une application importante, il faudrait resoudre ce probleme. 

Nous arrondissons la taille du fichier a crypter au multiple de 8 superieur. Puis, nous projetons 
ce fichier en memoire avec mmap( ). Nous pouvons alors appeler ecb_crypt( ) pour effectuer le 
codage. 

exemple_ecb_crypt.c 

#define _GNU_SOURCE 

#include <fcntl .h> 

#include <stdio.h> 

#include <string.h> 

#include <unistd.h> 

#include <sys/mman.h> 

#include <sys/stat.h> 

#include <rpc/des_crypt.h> 

int 

main (int argc, char * argv[]) 
{ 



char * 


nom_programme; 


i nt 


fichier; 


struct stat 


etat_fichier; 


long 


taille_fichier; 


char * 


projection; 


char 


cle[8]; 


unsigned 


mode; 


int 


retour; 



if (argc != 3) { 

fprintf (stderr, "Syntaxe Is : fichier cle \n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

1 

nom_programme = basename(argv[0] ) ; 



434 



Programmation systeme en C sous Linux 



if (strcasecmp(nom_programme, "des_decrypte" ) == 0) 
mode = DES_DECRYPT; 

el se 

mode = DES_ENCRYPT; 
if ((fichier = open(argv[l] , 0_RDWR)) < 0) { 
perror( "open" ) ; 
exit(EXIT_FAILURE); 

} 

if (stat(argv[l], & etat_fichier) != 0) { 
perror( "stat" ) ; 
exit(EXIT_FAILURE); 

} 

taille_fichier = etat_fichier.st_size; 
taille_fichier = ((taille_fichier + 7) » 3) « 3; 
projection = (char *) mmap(NULL, taille_fichier, 

PR0T_READ | PR0T_WRITE, MAP_SHARED, fichier, 0); 
if (projection == (char *) MAP_FAI LED) { 

perror( "mmap" ) ; 

exit(EXIT_FAILURE); 

} 

close(fichier) ; 
strncpy(cle, argv[2], 8); 
des_setparity(cle) ; 

retour = ecb_crypt(cle, projection, taille_fichier, mode); 
if (DES_FAILED(retour) ) { 

perror( "ecb_crypt" ) ; 

exit(EXIT_FAILURE); 

} 

munmaptprojection, taille_fichier) ; 
return EXIT_SUCCESS ; 

} 

Voici l'utilisation du programme : 
$ make 

In -sf exempl e_ecb_crypt des_crypte 

In -sf exempl e_ecb_crypt des_decrypte 

cc -Wall -g exempl e_ecb_crypt.c -o exempl e_ecb_crypt 

$ cat > fichier_a_crypter 

Voici un fichier que nous 

allons crypter avec la 

bibliotheque DES. 

(Controle-D) 
$ ./des_crypte fichier_a_crypter clelinux 
$ cat fichier_a_crypter 

N=JA EW_§giB_eNx430"P o._0*_'g n(j i Ep6Up...w Nf0i 0_My/#...ahOae>Tr"k"i ?$ 

$ ./des_decrypte fichier_a_crypter clelinux 

$ cat fichier_a_crypter 

Voici un fichier que nous 

allons crypter avec la 

bibliotheque DES. 

$ 



Routines avancees de traitement des blocs memoire 

Chapitre 16 



Nous voyons bien que le fichier crypte etait totalement illisible. Ce petit programme souffre 
beaucoup du manque d'efficacite dans la creation de la cle, mais ce defaut mis a part, il pour- 
rait servir de modele pour la creation d'un utilitaire permettant de dissimuler le contenu de 
fichiers personnels, meme pour radministrateur root. 

Conclusion 

Ce chapitre nous a permis de detailler Femploi de routines particulierement puissantes de la 
GlibC pour manipuler des expressions regulieres ou crypter des donnees. 

La cryptographic est un domaine complexe, necessitant de solides connaissances mathemati- 
ques. On en trouvera une presentation claire dans [BECKETT 1990] Introduction aux methodes 
de la cryptologie. Pour utiliser le logiciel PGP, en attendant de disposer d'une documentation 
sur GPG, on se tournera vers [GARFINKEL 1995] PGP Pretty Good Privacy. 

Le prochain chapitre concernera l'utilisation de donnees structurees en memoire a des fins de 
tri et de recherche rapide. 
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Les algorithmes mis en ceuvre lors des operations de tri ou de recherche de donnees peuvent 
etre tres simples ou au contraire extremement compliques. La bibliotheque C nous propose 
plusieurs variantes entre lesquelles nous choisirons, au gre des caracteristiques de F applica- 
tion. 

Nous allons tout d'abord etudier les routines de comparaison entre elements que l'utilisateur 
doit fournir aux routines de la bibliotheque C. Puis, nous examinerons les recherches lineaires 
dans une table, ainsi qu'une amelioration interessante concernant les donnees autoorganisa- 
trices. 

Nous verrons par la suite comment trier rapidement une table, afin de pouvoir utiliser une 
recherche dichotomique plus rapide. Une section sera consacree a l'etude des arbres binaires, 
qui sont une structure de donnees permettant des operations de recherche rapides. 

Nous analyserons enfin les fonctions que la bibliotheque GlibC met a notre disposition pour 
manipuler des tables de hachage, des structures particulierement precieuses pour gerer des 
listes de mots ou de symboles, par exemple. 

Fonctions de comparaison 

L'essentiel des fonctions presentees dans ce chapitre necessite de pouvoir comparer des 
donnees, afin de les ordonner ou simplement pour identifier l'element recherche. Cette 
comparaison peut etre effectuee sur plusieurs criteres variant en fonction du type de donnees 
stockees. Lorsqu'il s'agit simplement de valeurs numeriques, on peut tres bien utiliser les 
comparaisons classiques <, =, ou >. Lorsqu'on doit comparer des mots, on peut imaginer 
employer strcmpO, quoique ce ne soit pas forcement le meilleur choix. Lorsqu'on veut 
comparer des enregistrements d'une base de donnees, il est necessaire de definir un champ 
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comme cle de recherche pour que la comparaison entre deux enregistrements s'effectue sur 
leurs membres ainsi choisis. 

Pour homogeneiser les operations, les routines de tri et de recherche recoivent en argument un 
pointeur sur une fonction ecrite par l'utilisateur, et qui devra prendre en arguments deux 
elements et renvoyer une valeur negative, nulle ou positive selon que le premier argument est 
considere comme inferieur, egal ou superieur au second. 

Le prototype d'une routine de comparaison sera done : 

int comparaison (const void * element_l, const void * el ement_2) ; 

Bien sur, celle-ci devra etre adaptee au type de donnees manipulees par le programme. Les 
arguments doivent etre declares comme des pointeurs void *, mais la bibliotheque C 
l'invoque en utilisant des pointeurs sur les objets a comparer. Voici quelques exemples : 

int 

compare_entiers (const void * arg_l, const void * arg_2) 
{ 

int entier_l = * ((int *) arg_l); 
int entier_2 = * ((int *) arg_2); 
return entier_l - entier_2; 

} 

int 

compare_chaines (void * arg_l, void * arg_2) 
{ 

return strcasecmp( (const char *) arg_l, (const char *) arg_2); 

} 

Nous voyons que, dans ce dernier cas, on aurait pu prendre directement un pointeur sur la 
fonction strcasecmp( ), a condition de forcer son type par un cast explicite. 

Voici un exemple de comparaison de donnees structurees : 
typedef struct { 

char * nom; 
char * prenom; 
time_t date_naiss; 
char * lieu_naiss; 

/* Champs non pris en compte dans la comparaison */ 

time_t date_d_inscription; 

long 1 ivre_emprunte; 
/* ... etc ... */ 
} individu_t; 

int 

compare_identites (const void * element_l, cont void * element_2) 
{ 

individu_t * individu_l = (individu_t *) element_l; 

individu_t * individu_2 = (individu_t *) element_2; 
int comparaison; 
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comparaison = strcasecmp(individu_l->nom, individu_2->nom) ; 
if (comparaison != 0) 
return comparaison; 

comparaison = strcasecmp(individu_l->prenom, individu_2->prenom) ; 
if (comparaison != 0) 
return comparaison; 

comparaison = individu_l->date_naiss - individu_2->date_naiss; 
if (comparaison != 0) 
return comparaison; 

comparaison = strcasecmp(individu_l->l ieu_naiss. 

individu_2->l ieu_naiss) ; 

return comparaison; 

} 

Nous faisons ici une comparaison successive sur les quatre criteres d' identification. Nous 
prendrons done une cle primaire representee par le nom, puis des cles secondaires constitutes 
successivement par le prenom, la date et le lieu de naissance. Nos enregistrements peuvent 
bien entendu contenir des champs qui ne sont pas pris en compte lors de la comparaison. 

Remarquons au passage que, dans certains cas, l'emploi de la comparaison strcasectnp( ) 
n'est pas le plus approprie. Lors des recherches sur les noms de famille par exemple, il existe 
toujours une marge assez importante d'incertitude concernant les fautes de frappe, les inver- 
sions de lettres dans un nom epele au telephone (je peux en temoigner personnellement...), 
ou simplement des problemes de mauvaise comprehension dus a un accent prononce. Pour 
assurer une certaine tolerance, on peut utiliser un algorithme de phonetisation. II en existe de 
nombreux, comme Soundex ou Metaphone, qui sont largement employes dans les logiciels 
de genealogie par exemple, et qui permettent de reduire un nom a ses consonnes les plus 
importantes. Les regies de phonetisation variant suivant la langue, il est conseille de recher- 
cher un algorithme adapte aux noms a comparer. 

Pour simplifier les prototypes des routines de recherche et de tri, la bibliotheque GlibC definit 
un type special, nomme comparison_fn_t, sous forme d' extension Gnu, qui correspond a une 
fonction de comparaison. Ce type est defini, en substance, ainsi : 

typedef int (* comparison_fn_t) (const void *, const void *); 
Lorsque nous trouverons, dans une liste d' arguments, une declaration 

int fonction_de_tri (... , comparison_fn_t compare, ...); 
cela signifiera que la fonction compare( ) est du genre : 

int compare (void * element_l, void * element2); 

La plupart des routines permettent de trier des tables contenant des elements de taille 
constante. Le tri des donnees de taille variable (chaines de caracteres par exemple) ne pose 
pas de probleme puisqu'il suffit d'ajouter un niveau d' indirection supplementaire en triant en 
realite une table de pointeur sur les donnees de taille variable. Bien entendu, il faudra tenir 
compte correctement de cette indirection dans la routine de comparaison. 
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Recherche lineaire, donnees non triees 

Les premieres fonctions que nous etudierons permettent de faire une recherche lineaire dans 
une table, aussi appelee recherche sequentielle. II s'agit simplement de parcourir toute la 
table jusqu'a trouver l'element correspondant a la cle recherchee. Cette methode n'a d'interet 
que si la table n'est pas ordonnee car, dans le cas contraire, nous verrons des routines beau- 
coup plus rapides pour acceder aux donnees. 

On peut s'interroger sur l'interet de conserver une table de donnees non ordonnee, alors qu'il 
existe des routines de tri simples et performantes. En fait, la recherche dans une table triee 
n'est interessante que si le nombre d' elements est suffisamment grand et si la table ne subit 
que peu de modifications. En effet, Finsertion ou la suppression de donnees sont obligatoire- 
ment plus couteuses dans une table triee que dans une table non ordonnee, puisqu'il faut faire 
appel a des routines specialisees pour placer l'enregistrement au bon endroit. 

Si notre table est « petite » (au maximum quelques dizaines d'enregistrements), et si la routine 
de comparaison est simple et rapide, il est plus commode de laisser la table non ordonnee et 
d'utiliser une recherche sequentielle. Ce choix sera egalement plus judicieux si la table 
change beaucoup. Cela signifie qu'on renouvelle le contenu de la table en permanence, et 
qu'un enregistrement donne n'est pas recherche plus de deux ou trois fois durant son exis- 
tence. Ainsi, j'ai employe une recherche sequentielle dans un logiciel dans lequel on recoit en 
permanence des positions d'avions en approche finale sur un aeroport. Chaque enregistre- 
ment n'existant dans notre liste que pendant une duree assez courte, alors qu'il y a des ajouts 
et des suppressions pratiquement toutes les secondes, l'utilisation d'une liste triee ne se justi- 
fiait pas. 

Les deux routines de recherche lineaire offertes par la bibliotheque GlibC sont nommees 
1 f ind( ) et lsearch( ). Leurs prototypes sont les suivants : 

void * lfind (const void * cle, const void * base, 
size_t * nb_el ements , size_t taille, 
comparison_fn_t compare); 

et 

void * lsearch (const void * cle, void * base, 

size_t * nb_el ements , size_t taille, 
comparison_fn_t compare); 

Elles sont declarees dans le fichier <search.h>. 

La premiere routine recherche l'element qui correspond a la cle fournie en premier argument 
dans la table commencant a l'adresse passee en second argument contenant * nb_el ements, et 
chaque element ayant la taille indiquee en quatrieme position Pour chercher la donnee corres- 
pondant a la cle, la fonction de comparaison fournie en derniere position est employee. On 
doit passer un pointeur sur le nombre d' elements, et non la veritable valeur, meme si son 
contenu n'est pas modifie par 1 f i nd( ). Si la routine trouve un element correspondant a la cle, 
elle renvoie un pointeur dessus. Sinon, elle renvoie NULL. 

Voici un exemple d'utilisation avec la structure de donnees i ndi vi du_t que nous avons definie 
plus haut : 

static individu_t * table_individus = NULL; 
static size_t nb_individus = 0; 
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individu_t * 

donne_individu (const char * nom, const char * prenom, 
time_t date, const char * lieu) 

{ 

individu_t cle; 
individu_t * retour; 

cle . nom = nom; /* On copie le pointeur, pas la chaine */ 
cle . prenom = prenom; 
cle . date_naiss = date; 
cle . lieu_naiss = lieu; 

retour = lfind(& cle, table_individus, & nb_individus, 
sizeof (individu_t) , compare_identites) ; 
if (retour != NULL) 
return retour; 

/* On ne 1'a pas trouve, on va en creer un nouveau */ 
table_individus = realloc(table_individus, 

sizeof (individu_t) * (nb_individus + 1)); 
if (table_individus == NULL) { 

perror( "mal 1 oc" ) ; 

exit(EXIT_FAILURE); 

} 

table_individus[nb_individus].nom = strdup(nom); 
table_individus[nb_individus]. prenom = strdup(prenom) ; 
table_individus[nb_individus].date_naiss = date; 
table_individus[nb_individus].lieu = strdupd ieu) ; 
time (& (table_individus[nb_individus].date_inscription)); 
table_individus[nb_individus].livre_emprunte = -1; 

nb_individus ++; 

return (& (table_individus[nb_individus - 1])); 

} 

Nous avons utilise dans cet exemple les structures deja definies plus haut, mais on remarquera 
par ailleurs que la gestion d'un fichier de ce type - probablement les inscriptions dans une 
bibliotheque - n'est justement pas adaptee a une organisation sequentielle, puisque les 
donnees varient peu et que le nombre d'enregistrements est certainement assez consequent. 

La fonction 1 search( ) recherche egalement Fenregistrement de maniere sequentielle dans la 
table fournie, mais si elle ne le trouve pas, elle ajoute un enregistrement a la fin, et incremente 
Fargument nb_el ements, sur lequel on doit passer un pointeur, comme avec lfindO. Cela 
signifie qu'il faut etre sur avant d'appeler 1 search ( ) de disposer d'au moins un emplacement 
supplemental libre dans la table. On l'utilise parfois en effectuant des allocations « par 
blocs », afin de reduire le nombre d'appels a real 1 oc( ). Voici un exemple : 

static individus * table_individus = NULL; 
static size_t nb_individus = 0; 
static size_t contenance_tabl e = 0; 

#define NB_BL0CS_AJOUTES 64 
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individu_t * 

donne_individu (const char * nom, const char * prenom, 
time_t date, const char * lieu) 

{ 

individu_t cle; 
individu_t * retour; 

if (contenance_table == nb_individus) { 
contenance_table += NB_BLOCS_AJOUTES; 
table_individus = realloc(table_individus, 

contenance_tabl e * sizeof (individu_t) ) ; 
if (table_individus == NULL) { 
perrorCrealloc"); 
exit(EXIT_FAILURE); 

} 

} 

cle. nom = nom; /* On copie le pointeur, pas la chaine */ 
cle. prenom = prenom; 
cle.date_naiss = date; 
cle.lieu_naiss = lieu; 

retour = lfind(& cle, table_individus, 

& nb_individus, sizeof(individu_t) , 

compare_identites) ; 
return retour; 

} 

On notera que, dans le cas d'une recherche sequentielle, la fonction de comparaison doit 
simplement renvoyer 0 si les elements concordent, et une autre valeur sinon. On n'a pas 
besoin d'indiquer si la premiere est inferieure a la seconde ou non. 

En fait, il est tres commode d'appeler les routines 1 f ind( ) ou 1 search ( ) si on desire imple- 
menter une table non triee pour debuter le developpement d'une application, quitte a se 
tourner ensuite vers une implementation plus structuree si le besoin s'en fait sentir. Les 
routines de recherche dans les tables ordonnees ou dans les arbres binaires ont une interface 
quasi identique, et la modification d'implementation est facile. 

Toutefois, si on desire conserver une table non triee, et si les fonctionnalites de recherche dans 
cette table sont critiques pour 1' application, on peut envisager de reimplementer ses propres 
routines a la place de celles de la bibliotheque GlibC. C'est l'un des rares cas ou une reecri- 
ture de fonctions existantes peut apporter quelque chose de sensible a une application, sans 
risque d'erreur, vu la simplicite de l'algorithme utilise. 

La fonction 1 find( ) est implemented, en substance, dans la GlibC ainsi : 
void * 

Ifind (const void * cle, const void * base, size_t * nb_elements, 
size_t taille, comparison_fn_t compare) 

{ 

const void * retour = base; 
size_t compteur = 0; 
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while ((compteur < *nb_elements) && ((*compare)(cle, retour) != 0)) { 
retour += taille; 
compteur ++; 

} 

return (compteur < *nb_el ements ? retour : NULL); 

} 

On peut reprocher deux choses a cette fonction : 

• Elle appelle pour chaque enregistrement la routine de comparaison, alors qu'on pourrait 
eviter la surcharge de code due a une invocation de fonction en integrant directement le 
code de comparaison dans la recherche sequentielle. 

• Elle effectue deux tests a chaque iteration, en verifiant a la fois si le compteur a atteint le 
nombre d' elements dans la table et si la comparaison a reussi. 

En fait, pour eviter de dupliquer le test a chaque iteration, il suffit d'ajouter un element fLctif a 
la fin de la table, dans lequel on copie la cle recherchee. On ne fait plus que la comparaison 
a chaque iteration. Lorsqu'on sort de la boucle, on verifie alors si on avait atteint le dernier 
element ou non. Cette methode oblige a toujours disposer d'un emplacement supplementaire 
en fin de table, mais il suffit d'allouer un element de plus a chaque appel real 1 oc( ). 

Nous pouvons alors ecrire une routine specialised pour nos donnees. Par exemple, pour 
rechercher un entier dans une table non triee : 

int * 

recherche_entier (int cle, int * table, int nb_entiers) 

{ 

int * resultat = table; 

/* on sait qu'on dispose d'un element supplementaire */ 
table[nb_entiers] = cle; 
while (cle != *resultat) 

resultat += sizeof(int); 
if (resultat == & (table[nb_entiers])) 

return NULL; 
return resultat; 

} 

Ceci nous permet d'augmenter les performances de cette recherche, en Fadaptant a nos 
donnees. Une autre amelioration peut parfois etre apportee en utilisant une organisation auto- 
matique des donnees. 

La recherche sequentielle balaye tous les enregistrements jusqu'a trouver celui qui convient. 
Lorsque le nombre d' enregistrements croit, la duree de la recherche augmente dans la meme 
proportion. On dit que la complexite de cet algorithme s'exprime en O(N), N etant le nombre 
de donnees dans la base. 

Lorsque tous les enregistrements presents ont la meme probabilite d'etre recherches, le 
parcours sequentiel balaye, en moyenne, N/2 elements. Toutefois, ceci n'est vrai que si les 
donnees sont equiprobables, c'est-a-dire si tous les enregistrements font l'objet d'une 
recherche le meme nombre de fois. 

Or, dans de tres nombreuses situations, certaines donnees sont beaucoup plus sollicitees que 
d'autres. A titre d'exemple, les secteurs d'un disque dur ou les mots d'un lexique obeissent 
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plutot a une loi dite 80-20, c'est-a-dire que 20 % des donnees font l'objet de 80 % des recher- 
ches. Et au sein de ces 20 %, la meme loi peut se repeter. 

Autrement dit, on a tout interet a trouver un moyen de placer en tete de table les donnees les 
plus frequemment recherchees. Pour cela, il existe une methode simple : a chaque fois qu'une 
recherche aboutit, l'element retrouve est permute avec celui qui le precede dans la table. Les 
donnees les plus demandees vont done remonter automatiquement au cours des recherches 
successives, afin de se trouver aux places de choix, celles qui necessitent un balayage 
minimal. De meme, les enregistrements qu'on ne reclame jamais vont descendre en fin de 
table, la oil la recherche dure le plus longtemps. 

La table s'organisant au fur et a mesure des demandes de Futilisateur, les resultats sont 
parfois etonnamment bons, surtout si on remarque que la plupart des recherches successives 
ne sont pas independantes et sont dictees par un centre d'interet commun qui reclame parfois 
le meme element a plusieurs reprises. C'est un phenomene un peu similaire a celui des 
memoires cache en lecture, qui permettent d'ameliorer sensiblement les performances d'un 
disque dur. 

On peut, par exemple, implementer ce mecanisme en ajoutant a la suite d'un appel a 1 f i nd ( ) : 

element_t * retour; 
element_t echange; 

retour = lfind (cle, table, & nb_elements, 

sizeof (el ement_t) , compare_elements) ; 
if ((retour ! = NULL) && (retour != table)) { 

memcpy(& echange, retour, sizeof (element_t) ) ; 

memcpyt retour, retour - sizeof(element_t) , sizeof (el ement_t) ) ; 

memcpy( retour - sizeof(element_t) , & echange, sizeof(element_t)); 

} 

Bien entendu, avec des types entiers ou reels par exemple, l'echange est bien plus simple. 
Attention, repetons que les tables autoorganisatrices fonctionnent uniquement si les donnees 
n'ont vraiment pas la meme probabilite d'etre recherchees. Ceci necessite done d' analyser 
precisement les elements dont on dispose lors de 1' implementation de l'application. 

Nous avons ainsi vu les mecanismes les plus simples pour rechercher des donnees non orga- 
nisees, ainsi que quelques astuces pouvant ameliorer les performances. Malgre tout, dans la 
majeure partie des cas, il est preferable d'essayer de trier le contenu de notre ensemble 
d' informations afin d'obtenir des recherches beaucoup plus rapides. 

Recherches dichotomiques dans une table ordonnee 

Lorsqu'on dispose d'une table ou les donnees sont triees, une recherche est bien plus rapide. 
II suffit en effet d'utiliser un algorithme de recherche dichotomique pour obtenir des perfor- 
mances tres interessantes. Le principe de la recherche dichotomique est simple : 

• on choisit un element au centre de la table triee et on le compare avec la cle recherchee ; 

• si la cle est egale a l'element, on a fini avec succes ; 

• si la cle est plus petite que l'element, on reitere le processus sur la moitie inferieure de la 
table ; 

• sinon, on recommence en partant de la moitie superieure de la table ; 
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• si la cle recherchee ne se trouve pas dans la table, on finira par se retrouver avec une 
portion reduite a un seul element, auquel cas on finira l'algorithme en echec. 

Cet algorithme nous garantit une complexite en 0(log(N)), ce qui signifie que lorsque le 
nombre N de donnees augmente, la duree de la recherche croit proportionnellement a log(N). 
Or, pour des valeurs suffisamment grandes, log(N) est tres inferieur a N. Cette recherche 
dichotomique est done largement plus rapide qu'une recherche sequentielle. 



Figure 17.1 

Recherche dichotomique 
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Si la recherche dichotomique parait simple a premiere vue, sa programmation Test beaucoup 
moins. Cet exercice classique revele des subtilites de mise en ceuvre, et la premiere tentative 
d'implementation est rarement exempte de defauts. Aussi, on se limitera autant que possible a 
utiliser directement la routine bsearchO de la bibliotheque C, qui implemente la recherche 
dichotomique de maniere exacte et optimisee, definie dans <stdl i b . h> : 

void * bsearch (const void *cle, const void * table, 
size_t nb_elements, size_t taille, 
comparison_fn_t compare); 

La seule difference avec le prototype de 1 search ( ) est qu'on passe le nombre d'elements du 
tableau et pas un pointeur sur ce nombre. 

Cette fonction renvoie un pointeur sur l'element recherche, ou NULL en cas d'echec. La fonc- 
tion de comparaison doit renvoyer une valeur positive ou negative en fonction de la position 
des deux elements compares, et non plus simplement une valeur nulle ou non nulle comme 
dans la recherche sequentielle. Si plusieurs elements de la table sont egaux, F algorithme ne 
precise pas celui qui sera trouve (contrairement a 1 search( ) qui rencontre toujours le premier 
d'abord). 

Avant de pouvoir utiliser bsearchO, il faut ordonner les donnees. Pour cela, il existe de 
nombreux algorifhmes plus ou moins performants, et la bibliotheque C en implemente deux, 
le choix etant effectue au moment de l'appel en fonction de la taille des donnees et de la 
disponibilite memoire. 

L'algorithme le plus efficace garantit une complexite en 0(N.log(N)), e'est-a-dire que la 
duree du tri croit proportionnellement a N.log(N) lorsque le nombre N d'elements augmente. 
Indiquons que les algorithmes de tri « evidents », comme le celebre tri a bulles, ont une 
complexite en 0(N 2 ), et rappelons que lorsque N est deja moyennement grand - quelques 
centaines d'elements - log(N) est nettement inferieur a N. 

Cet algorithme necessite un espace de stockage de taille identique a la table a trier. Le prin- 
cipe consiste a separer recursivement la partition a trier en deux ensembles de taille identique 
a un element pres. Ces deux ensembles sont alors tries separement par appel recursif de 
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l'algorithme. Ensuite, on melange les donnees triees dans la memoire temporaire en les 
parcourant une seule fois, par comparaisons successives. La memoire temporaire est alors 
recopiee dans la table a present ordonnee. 

Cet algorithme est optimal en termes de rapidite, mais il necessite un espace de stockage 
temporaire qui peut parfois etre exagere si on trie par exemple le contenu d'un fichier projete 
en memoire avec mmap ( ). Aussi, la bibliotheque GlibC en propose un second qui est presque 
aussi efficace et qui ne necessite pas de memoire auxiliaire : le quicksort (tri rapide). Ce tri, 
decrit par C. Hoare en 1952, est particulierement celebre, et la GlibC implemente de surcroit 
des ameliorations pour augmenter encore ses performances. 

Le quicksort repose sur la division successive de la table a trier en partitions de taille de plus 
en plus reduite. Le principe consiste a choisir dans la partition a ordonner une valeur 
mediane, dite pivot, et a scinder la partition en deux sous-ensembles distincts, l'un contenant 
uniquement des valeurs inferieures au pivot, et 1' autre comprenant seulement des valeurs 
superieures au pivot. Pour effectuer ce decoupage rapidement, on utilise deux pointeurs : 
l'un partant du bas de la partition et remontant progressivement jusqu'a rencontrer une valeur 
plus grande que le pivot, et F autre partant symetriquement du haut de la partition pour 
descendre jusqu'a trouver un element inferieur au pivot. Si les deux pointeurs se sont croises, 
la separation en deux sous -partitions est finie, sinon on echange les deux elements rencontres 
et on continue. Le processus est alors repete sur les deux nouvelles partitions, jusqu'a avoir 
des sous-ensembles ne contenant que trois elements ou moins, et la table originale est alors 
entierement triee. 

L'eventuelle complication avec le quicksort reside dans le choix du pivot. Dans l'algorithme 
original, on propose d'utiliser comme pivot le premier element de la table, ce qui simplifie la 
suite des operations puisqu'il suffit de placer le pointeur bas sur le deuxieme element et le 
pointeur haut sur le dernier, sans se soucier de rencontrer le pivot lui-meme. Toutefois, cela 
pose un grave probleme sur les tables deja ordonnees. En effet, le decoupage obtenu est alors 
catastrophique puisqu'il contient une sous-partition ne comprenant qu'un seul element, et une 
seconde comportant les N - 1 autres. La complexite de l'algorithme n'est plus 0(N.log(N)) 
mais approche au contraire 0(N 2 ). 

Pour eviter ce probleme, la GlibC choisit comme pivot une valeur mediane entre le premier 
element du tableau, le dernier et un element place au milieu. Meme si la table est deja 
ordonnee, la performance du tri reste intacte. De meme, la bibliotheque GlibC evite d'utiliser 
le quicksort lorsque la taille des partitions devient petite (quatre elements en 1' occurrence), et 
elle se tourne alors vers un tri par insertion qui est plus efficace dans ce cas. Enfin, les perfor- 
mances de 1' implementation sont encore ameliorees en evitant d'utiliser la recursivite natu- 
relle de l'algorithme, mais en gerant directement une liste des partitions a traiter. 

La GlibC emploie done autant que possible le tri avec une memoire auxiliaire, sinon elle se 
tourne vers le quicksort. La routine qsortO, declaree dans <stdlib.h>, qui tire son nom du 
quicksort utilise dans 1' implementation traditionnelle sous Unix, est tres simple d'utilisation : 

void qsort (void * table, 

size_t nb_elements, size_t taille_element, 
comparison_fn_t compare); 

Voici un exemple de programme qui cree une table de valeurs aleatoires, puis qui invoque 
qsort ( ) pour les trier. 
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exemple_qsort.c : 

#include <stdio.h> 
#include <stdlib.h> 

int 

compare_entiers (const void * elem_l, const void * elem_2) 

{ 

return (* (tint *) elem_l) - * (tint *) elem_2)); 

} 

#define NB_ENTI ERS 100 

int 
main (void) 

{ 

int table_entiers[NB_ENTIERS] ; 
int i ; 

for (i = 0; i < NB_ENTI ERS ; i ++) { 

/* On limite un peu la taille des entiers pour 1'affichage */ 
table_entiers[i] = randO & OxFFFF; 
fprintf (stdout, "%05d ", table_entiers[i]); 

} 

fprintf (stdout, "\n \n"); 

qsort(table_entiers, NB_ENTI ERS , sizeof(int), compare_entiers) ; 
for (i = 0; i < NB_ENTI ERS ; i ++) 

fprintf (stdout, "%05d ", table_entiers[i]); 
fprintf (stdout, "\n"); 
return EXIT_SUCCESS; 

} 

Voici un exemple d'execution : 
$ ./exemple_qsort 

17767 09158 39017 18547 56401 23807 37962 22764 07977 31949 22714 55211 16882 07931 

* 43491 57670 00124 25282 02132 10232 08987 59880 52711 17293 03958 09562 63790 
29283 49715 55199 50377 01946 64358 23858 20493 55223 47665 58456 12451 55642 

24869 35165 45317 41751 43096 23273 33886 43220 48555 36018 53453 57542 30363 40628 
09300 34321 50190 07554 63604 34369 62753 48445 36316 61575 06768 56809 51262 
54433 49729 63713 44540 09063 33342 24321 50814 10903 47594 19164 54123 30614 

55183 42040 22620 20010 17132 31920 54331 01787 39474 52399 36156 36692 35308 06936 

* 32731 42076 63746 18458 30974 47939 

00124 01787 01946 02132 03958 06768 06936 07554 07931 07977 08987 09063 09158 09300 
09562 10232 10903 12451 16882 17132 17293 17767 18458 18547 19164 20010 20493 
22620 22714 22764 23273 23807 23858 24321 24869 25282 29283 30363 30614 30974 

31920 31949 32731 33342 33886 34321 34369 35165 35308 36018 36156 36316 36692 37962 
39017 39474 40628 41751 42040 42076 43096 43220 43491 44540 45317 47594 47665 

* 47939 48445 48555 49715 49729 50190 50377 50814 51262 52399 52711 53453 54123 
54331 54433 55183 55199 55211 55223 55642 56401 56809 57542 57670 58456 59880 61575 

62753 63604 63713 63746 63790 64358 

$ 
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La routine qsortO de la bibliotheque GlibC etant pratiquement optimale, il est fortement 
conseille d'y faire appel aussi souvent que possible, et de n'implementer sa propre routine de 
tri que pour des applications vraiment specifiques. 

L' inconvenient que pose la fonction bsearch( ) est qu'il n'est pas facile d'ajouter simplement 
un element si on ne le trouve pas. Pour cela, il faut inserer l'element a la fin de la table par 
exemple, et invoquer qsort( ) pour la trier a nouveau. C'est interessant si on peut grouper de 
multiples ajouts, mais peu efficace pour des ajouts isoles et frequents. Voici done une routine 
qui peut servir a ajouter un seul element si on ne le trouve pas. Elle suppose que la table 
contient suffisamment de place pour adjoindre au moins une donnee. 

void * 

b_insert (const void * cle, const void * table, 

size_t * nb_elements, size_t taille_element, 

int (* compare) (const void * 1ml, const void * lm2)) 

{ 

const void * element; 
int comparaison; 

size_t bas = 0; 

size_t haut = (* nb_elements) ; 

size_t milieu; 

while (bas < haut) { 

milieu = (bas + haut) / 2; 

element = (void *) (((const char *) table) 

+ (milieu * taille_element)); 
comparaison = compare(cle, element); 
if (comparaison < 0) 

haut = milieu; 
else if (comparaison > 0) 

bas = milieu + 1; 

el se 

return ((void *) element); 

} 

/* Ici, haut = bas, on n'a pas trouve l'element, 

* on va 1 'ajouter, mais nous devons verifier de 

* quel cote de l'element "haut". 
*/ 

if (haut >= (* nb_elements)) { 

element = (void *) (((const char *) table) 

+ ((* nb_elements) * tai 1 le_el ement) ) ; 

} else { 

element = (void *) (((const char *) table) 

+ (haut * tai 1 le_element) ) ; 
if (compare (cle, element) > 0) ( 

element += tai 11 e_el ement; 

haut ++; 

} 

memmove( (void *) element + tai lle_el ement, 
(void *) element, 
(* nb_elements) - haut); 
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} 

memcpy( (void *) element, cle, taille_element); 
(* nb_elements) ++; 
return (void *) element; 

} 

La premiere partie de cette fonction est calquee sur la routine bsearch( ) . implementee dans 
la GlibC. Ensuite, au lieu d'echouer et de renvoyer NULL, elle ajoute l'element dans la table, en 
le positionnant au bon endroit. 

Voici un programme qui utilise cette routine pour ajouter un caractere dans une chaine lue 
en argument de ligne de commande. Nous ne repetons pas 1' implementation de la routine 
b_insert( ). 

exemple_qsort 2.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 

int 

compare_char (const void * lml, const void * lm2) 
{ 

return ((char *) lml)[0] - ((char *) lm2)[0]; 

} 

int 

main (int argc, char * argv[]) 

{ 

char * table = NULL; 
int longueur; 

if (argc != 3) { 

fprintf (stderr, "syntaxe: %s table element\n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

longueur = strl en(argv[l] ) ; 

if ((table = mallocdongueur + 2)) == NULL) { 

perror( "mal 1 oc" ) ; 

exi t(EXIT_FAI LURE); 

} 

strcpy(table, argv[l]); 

fprintf (stdout, "tri avec qsort ...\n"); 
qsortttable, strlen(table) , 1, compare_char) ; 
fprintf (stdout, "£s\n", table); 

fprintf (stdout, "recherche / insertion de %c\r\" , argv[2][0]); 
b_insert( (void *) argv[2], table, & longueur, 1, compare_char) ; 
tabl e[l ongueur] = '\0' ; 
fprintf (stdout, "£s\n", table); 
return EXIT_SUCCESS; 

} 
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Le premier argument est une chaine de caracteres, qu'on trie avec qsort( ) apres l'avoir reco- 
piee en reservant une place supplementaire pour F insertion. 

La routine b_insert( ) ajoute ensuite le caractere se trouvant au debut du second argument, 
s'il ne se trouve pas deja dans la chaine. Voici les differents cas de figure possibles : 

$ ./exemple_qsort_2 ertyuiop a 

tri avec qsort . . . 
eioprtuy 

recherche / insertion de a 
aeioprtuy 

$ ./exemple_qsort_2 ertyuiop z 
tri avec qsort . . . 
eioprtuy 

recherche / insertion de z 
eioprtuyz 

$ ./exemple_qsort_2 ertyuiop 1 
tri avec qsort . . . 
eioprtuy 

recherche / insertion de 1 
ei 1 oprtuy 

$ ./exemple_qsort_2 ertyuiop i 
tri avec qsort . . . 
eioprtuy 

recherche / insertion de i 
eioprtuy 
$ 

II peut parfois etre genant de reimplementer sa propre routine pour effectuer des ajouts, et on 
prefererait que cette fonctionnalite soit directement incorporee dans la bibliotheque C. On 
peut alors se tourner vers une autre structure de donnees, qui est entierement geree par des 
fonctions internes de la GlibC, et qui fournit des performances remarquables en termes de 
complexite : les arbres binaires. 



Manipulation, exploration et parcours d'un arbre binaire 

Un arbre binaire est une organisation de donnees tres repandue en algorithmique. II s'agit 
d'une representation des elements sous forme de nceuds, chacun d'eux pouvant avoir 0, 1, ou 
2 nceuds fils. On represente generalement les arbres binaires avec, au sommet, un nceud parti- 
culier nomme racine, qui n'a pas de pere. Les fils d'un nceud lui sont rattaches par un lien. Un 
nceud sans fils est nomme feuille. 

La dimension d'un arbre est egale au nombre de nceuds qui le composent, tandis que sa 
profondeur correspond a la plus grande distance qui separe la racine d'un nceud feuille. Toute 
ces notions sont assez intuitives des qu'on a assimile que notre arbre - tel ses congeneres 
genealogiques - pousse la tete en bas . . . 

Les arbres binaires ordonnes presentent de surcroit la particularite suivante : 

• Le fils gauche d'un nceud contient une valeur inferieure ou egale a celle de son pere. 

• Le fils droit d'un nceud comprend une valeur superieure ou egale a celle de son pere. 
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Figure 17.2 

Arbre binaire 




Figure 17.3 

Arbre ordonne 




dimensions = 10 
profondeur = 4 
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La recherche d'un element dans un tel arbre necessite done, au maximum, un nombre de 
comparaison egal a la profondeur de F arbre, soit log(N), N etant sa dimension si F arbre est 
correctement equilibre. 

A premiere vue, il est aise d'inserer une donnee, puisqu'il suffit de creer un nouveau nceud 
qu'on rattachera en tant que fils du dernier nceud feuille qu'on a rencontre lors de la verifica- 
tion de F existence de cet element. 

Malheureusement, cette technique n'est pas exploitable en realite, car lors de Fajout successif 
d' elements deja ordonnes, on va creer un arbre constitue uniquement de nceuds ayant un seul 
fils. L' arbre aura une profondeur egale a sa dimension, et la recherche d'un element sera equi- 
valente a une recherche sequentielle ! 

\ 



> dimension = 10 
profondeur = 10 



Pour eviter cela, il est necessaire d'equilibrer Farbre a chaque ajout ou suppression de nceud. 
La bibliotheque GlibC Feffectue automatiquement en utilisant un algorithme assez compli- 
que fonde sur un « coloriage » des nceuds en rouge ou en noir, et verifiant a chaque modifi- 
cation l'equilibre de la structure complete. L' arbre restant done equilibre, la recherche d'un 
element croit done suivant log(N) lorsque N augmente, ce qui est presque ideal. De plus, il est 
possible de parcourir automatiquement tout Farbre suivant diverses methodes, afin de le 
sauvegarder de maniere ordonnee par exemple. 

L'arbre est represente en interne par des structures qui ne nous concernent pas. Pour Futiliser, 
nous lui transmettrons simplement des pointeurs sur nos donnees, convertis en pointeur 
voi d *. La racine de l'arbre est aussi representee par un pointeur de type voi d *, qu'on initia- 
lise a Forigine a NULL avant d'inserer des elements. Cette insertion se fait en employant la 
routine tsearchO, declaree ainsi dans <search.h> : 

void * tsearch (const void * cle, void ** racine, 
comparison_fn_t compare); 

Cette routine recherche la cle transmise et, si elle ne la trouve pas, Finsere dans l'arbre. La 
fonction renvoie un pointeur sur F element trouve ou cree, ou NULL si un problems d' allocation 
memoire s'est presente. On notera qu'on doit transmettre un pointeur sur la racine de l'arbre, 
elle-meme definie comme un pointeur voi d *. En effet, la fonction peut a tout moment modi- 
fier cette racine pour reorganise! - l'arbre. 



Figure 17.4 

Insertion naive d 'elements 
deja ordonnes 





Tris, recherches et structuration des donnees 

Chapitre 17 



II existe une fonction tfind( ) permettant de rechercher un element sans le creer s'il n'existe 
pas : 

void * tfind (const void * cle, void ** racine, compari son_fn_t compare); 
Si la cle n'est pas rencontree dans l'arbre, la fonction renvoie NULL. 

Pour supprimer un element, on utilise la fonction tdel ete( ), qui assure egalement le reequili- 
brage de l'arbre : 

void * tdelete (const void * cle, void ** racine, 
compari son_fn_t compare); 

L' element est supprime mais sa valeur est renvoyee par la fonction, sauf dans le cas ou la cle 
n'a pas ete trouvee, la routine retournant alors NULL. 

Enfin, si on veut supprimer completement un arbre, on peut utiliser la routine tdestroy ( ), qui 
est une extension Gnu declaree ainsi : 

void tdestroy (void * racine, void (* liberation) (void * element)); 

La routine 1 iberation( ) sur laquelle on passe un pointeur est invoquee sur chaque nceud de 
l'arbre, avec en argument la valeur du nceud. 

Nous avons vu les fonctions d'insertion, de recherche et de suppression d'elements dans un 
arbre binaire. Nous allons a present examiner la routine twalkO qui permet de parcourir 
l'ensemble de l'arbre en appelant une fonction de l'application sur chaque nceud. Cette fonc- 
tion doit etre definie ainsi : 

void action (const void * noeud, const VISIT methode, 
const int profondeur); 

Lorsqu'elle sera invoquee, elle recevra en premier argument un pointeur sur le nceud. Autre - 
ment dit, pour acceder aux donnees proprement dites, il faudra utiliser **noeud. Le second 
argument contient l'une des valeurs du type enum VISIT suivantes : leaf, preorder, post- 
order ou endorder, en fonction du moment oil la fonction a ete appelee. Nous detaillerons tout 
cela ci-dessous. Enfin, le troisieme argument comprend la profondeur du nceud. 

Le parcours se fait en profondeur d'abord, de gauche a droite. Lorsque la fonction twal k( ) 
arrive sur un nceud, elle verifie tout d'abord s'il s'agit d'un nceud interne ou d'une feuille. Si 
c'est une feuille, elle appelle la routine d'action avec la methode leaf dans le second argu- 
ment, puis elle se termine. 

Si c'est un nceud interne, elle invoque la routine d'action avec la methode preorder, puis 
s' appelle recursivement sur le nceud his gauche. Au retour de son his gauche, elle appelle la 
routine d'action avec la methode postorder, avant de descendre recursivement le long du 
his droit. Enfin, avant de se terminer, elle invoque a nouveau la fonction d'action, avec la 
methode endorder. 

Pour chaque nceud interne, la routine d'action est done appelee trois fois, et une fois pour 
chaque feuille de l'arbre. La fonction peut choisir d'agir ou non en fonction de la methode 
avec laquelle elle a ete appelee. 

L'une des applications les plus pratiques est d'afficher les donnees lorsqu'elles se presentent 
sous forme leaf ou postorder. Cela permet d'obtenir la liste triee. Nous allons presenter un 
exemple qui construit un arbre binaire a partir de chaines de caracteres, en utilisant tsea rch ( ) . 
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Figure 17.5 

Ordre d'invocation 
de la routine d 'action 
avec twalk( ) 




leaf leaf 



Chaque chaine ne contient qu'un seul caractere pour simplifier l'affichage. Ensuite, nous 
allons verifier que les chaines sont toutes dans le tableau en utilisant tf i nd( ). 

Puis, nous emploierons twal k( ) avec, a chaque fois, une selection suivant une methode parti - 
culiere. Dans tous les cas, les feuilles leaf sont affichees. 

exemplejsearch.c : 

//include <search.h> 
//include <stdio.h> 
//include <stdlib.h> 
//include <string.h> 

int 

compare_char (const void * 1ml, const void * lm2) 
{ 

return strcmpdml, lm2); 

} 

static VISIT type_parcours ; 
void 

parcours (const void * noeud, const VISIT methode, const int profondeur) 
{ 

if (methode == type_parcours) 

fprintf (stdout, "%s ", * (char **) noeud); 
else if (methode == leaf) 

fprintf(stdout, "(%s) ", * (char **) noeud); 

} 
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int 
main (void) 



i nt 



1 ; 



void * racine = NULL; 

char * chaines[] = { 

"A", "Z", "E", "R", "T", "Y", "U", "I", "0", "P", 

"Q" , "S", "D", "F", "G" , " H " , "J", "K" , "L", "M" , 

"W", "X", "C", "V", "B", " N " , NULL, 



/* Insertion des chaines dans l'arbre binaire */ 
for (i = 0; chaines[i] != NULL; i ++) 

if (tsearch(chaines[i ] , & racine, compare_char) == NULL) { 

perror( "tsearch" ) ; 

exit(EXIT_ FAILURE); 

} 

for (i = 0; chaines[i] != NULL; i ++) 

if (tfind(chaines [i], & racine, compare_char) == NULL) { 
fprintf (stderr, "Is perdue ?\n", chaines[i]); 
exit(EXIT_ FAILURE); 

} 

fprintf (stdout, "Parcours preorder (+ leaf) : \n "); 
type_parcours = preorder; 
twalktracine, parcours); 
fprintf (stdout, "\n"); 

fprintf (stdout, "Parcours postorder (+ leaf) : \n "); 
type_parcours = postorder; 
twalktracine, parcours); 
fprintf (stdout, "\n"); 

fprintf (stdout, "Parcours endorder (+ leaf) : \n "); 
type_parcours = endorder; 
twalktracine, parcours); 
fprintf (stdout, "\n"); 

fprintf (stdout, "Parcours leaf : \n "); 
type_parcours = leaf; 
twalktracine, parcours); 
fprintf (stdout, "\n"); 

return EXIT_SUCCESS; 

} 

Voici le resultat de 1' execution de ce programme : 

$ ./exemple_tsearch 

Parcours preorder (+ leaf) : 

0 G E C A (B) (D) (F) I (H) K (J) M (L) (N) T Q (P) R (S) Y W U (V) (X) (Z) 
Parcours postorder (+ leaf) : 

A (B) C (D) E (F) G (H) I (J) K (L) M (N) 0 (P) Q R (S) T U (V) W (X) Y (Z) 
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Parcours endorder (+ leaf) : 

(B) A (D) C (F) E (H) (J) (L) (N) M K I G (P) (S) R Q (V) U (X) W (Z) Y T 0 
Parcours leaf : 

BDFHJLNPSVXZ 

$ 

Nous verifions bien que l'affichage ordonne des elements s'obtient avec les methodes 1 eaf et 
postorder. On peut d'ailleurs, en observant ces resultats, retrouver la structure de l'arbre 
binaire interne gere par la bibliotheque C. 



Figure 17.6 

Arbre obtenu par insertion 
des lettres de I 'alphabet 




Nous avons done vu ici une structure de donnees souple donnant de bons resultats, tant en 
termes d'insertion de nouveaux elements qu'en recherche de donnees. Nous allons a present 
etudier les routines permettant de gerer des tables de hachage, puisqu'elles peuvent en theorie 
offrir une complexite constante, e'est-a-dire une duree de recherche n'augmentant pas quand 
le nombre de donnees croit de maniere raisonnable. 

Gestion d une table de hachage 

Une table de hachage est une structure de donnees particuliere, dans laquelle on accede direc- 
tement aux elements en calculant leur adresse a partir de leur cle. Cette organisation est parti- 
culierement interessante car le temps d'acces aux elements ne depend pas de la taille de la 
table. Elle est toutefois soumise a plusieurs contraintes : 

• II faut indiquer le nombre maximal d'elements dans la table des sa creation. Cette taille ne 
peut etre modifiee ulterieurement. 

• L'acces aux donnees est tres efficace tant que le taux de remplissage de la table est assez 
faible (disons inferieur a 50 %). Les performances se degradent par la suite et deviennent 
mauvaises a partir de 80 % de remplissage environ. 

• II n'est pas possible de supprimer un element de la table. Si cette fonctionnalite est neces- 
saire, il faudra utiliser un indicateur dans le corps meme des donnees, pour marquer 
Felement comme « detruit ». 
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La table de hachage est done une organisation ideale pour les elements qu'on ajoute une seule 
fois, et dont le nombre maximal est connu des le debut. Par exemple, on utilise frequemment 
une table de hachage dans les compilateurs pour stocker les mots-cles d'un langage, dans les 
editeurs de liens pour memoriser les adresses associees aux symboles, ou dans les verifica- 
teurs orthographiques pour acceder au lexique d'une langue. 

Le principe d'une table de hachage repose sur une fonction permettant de transformer la cle 
associee a un evenement en une valeur pouvant servir d'adresse, d'indice dans une table. 
Cette fonction doit done repartir les cles, le plus uniformement possible, dans Fintervalle 
compris entre 0 et le nombre maximal M d'elements dans la table. 

Les cles utilisees dans les tables de hachage gerees par la bibliotheque GlibC sont des chaines 
de caracteres. La bibliotheque appelle une fonction permettant de transformer la chaine de 
caracteres en un unsigned int. Elle utilise ensuite une premiere fonction de hachage consti- 
tute simplement de 1' operation modulo M. La valeur resultante est employee alors comme 
adresse dans la table. 



Figure 17.7 

Gestion d'une table de hachage 
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Plusieurs chaines de caracteres differentes peuvent malheureusement se transformer en une 
valeur identique a Tissue de ce hachage. On dit alors qu'il y a une collision dans la table. Pour 
resoudre les collisions, plusieurs methodes sont possibles : 

• On utilise, pour chaque entree dans la table, une liste de tous les elements correspondants. 
Cette methode est appelee chatnage separe, elle augmente sensiblement la taille memoire 
requise et le temps d'acces aux elements. Toutefois, la taille initiale de la table n'est plus 
une limite stricte. 

• Lors de l'insertion d'un element, si sa place est deja occupee, on verifie l'emplacement 
suivant et, s'il est libre, on le prend. Sinon, on passe au suivant, et ainsi de suite, en reve- 
nant au debut une fois la fin de la table atteinte, jusqu'a explorer toute la table. Cette 
methode nommee hachage lineaire necessite parfois de parcourir toute la table, et est done 
inefficace lorsque le taux de remplissage est eleve. 

• On peut utiliser le meme principe que le hachage lineaire, mais en employant une seconde 
fonction de hachage pour parcourir la table, plutot que de se deplacer d'un seul cran a 
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chaque fois. Cette methode dite de I'adressage ouvert permet de separer plus facilement 
des chaines qui donnaient le meme resultat avec la premiere fonction de hachage. Elle 
conserve toutefois les memes defauts lorsque le taux de remplissage augmente. 

La bibliotheque GlibC est implemented en utilisant un adressage ouvert, avec une premiere 
fonction de hachage donnant simplement le modulo M de la valeur numerique obtenue avec la 
cle, et une seconde fonction de hachage valant (1 + la valeur de hachage precedente) modulo 
(M -2). Cette fonction est suggeree par le paragraphe 6.4 de [Knuth 1973c]. 

Pour que ces fonctions donnent des resultats satisfaisants, il est necessaire que M soit un 
nombre premier. Lors de la creation de la table, la bibliotheque C augmente done silencieuse- 
ment la valeur transmise au nombre premier le plus proche. II ne faut done pas s'etonner de 
pouvoir exceptionnellement depasser la taille maximale de la table sans pour autant declen- 
cher une erreur. 

Nous comprenons egalement a present pour quelle raison il n'est pas possible de detruire un 
element d'une table de hachage, car sa presence peut avoir oblige un autre element a se placer 
plus loin dans la table a la suite d'une collision. Si on libere F emplacement, la prochaine 
recherche aboutira a une adresse vide, et on en conclura que la cle recherchee n'existe pas. 

Pour creer une table de hachage, on utilise la fonction hcreate( ), declaree dans <search . h> : 

int hcreate (size_t taillejnaximale); 

Cette routine cree une nouvelle table de hachage vide dans un espace de memoire global et 
renvoie une valeur non nulle en cas de reussite. Si une table existe deja ou s'il n'y a pas assez 
de memoire disponible, la fonction echoue et renvoie 0. 

Le fait que la table soit allouee dans une zone de memoire globale pose deux problemes : 

• II n'est possible d'utiliser qu'une seule table de hachage a la fois. 

• Lemploi de la table par un programme multithread n'est pas sur. 

Aussi, la bibliotheque GlibC propose-t-elle, sous forme d'extension Gnu, de gerer des tables 
distinctes en utilisant un pointeur transmis par le programme appelant, dans lequel les 
elements necessaires au stockage sont reunis. Le type correspondant a une table de hachage 
est struct hsearch_data, et on passe aux routines un pointeur sur cette variable. Les champs 
internes de la structure hsearch_data ne sont pas documented, aussi utilisera-t-on memsetO 
pour initialiser l'ensemble de la structure a zero. 

Les routines hcreate_r(), hsearch^rO et hdestroy_r( ) , permettant de traiter des tables de 
hachage explicitement passees en arguments, sont done utilisables en programmation multi- 
thread. 

int hcreate_r (size_t taille_maximale, struct hsearch_data * table); 
On l'utilisera done ainsi : 

hsearch_data table; 

memset (& table, 0, sizeof (table)); 

if (hcreate_r (nb_el ementsjnaxi , & table) == 0) { 

perror ( "hcreate_r" ) ; 

exit (1); 

} 
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Lorsqu'on a fini d'utiliser une table, on la detruit avec hdestroy( ) 

void hdestroy (void) ; 
pour la table globale, ou 

void hdestroy_r (struct hsearch_data * table); 
pour les tables independantes. 

Les elements qu'on stocke dans une table de hachage sont du type ENTRY. Cette structure 
contient deux champs : 



Type 


Norn 


Signification 


char * 


key 


La cle qu'on utilise pour le hachage, consistant en une chalne de caracteres terminee par 
un zero. 


char * 


data 


Un pointeur sur une chaine de caracteres (ou sur tout autre type de donnees, avec la 
conversion char * pour ('initialisation). Ce pointeur est copie lorsqu'une entree de la table 
est creee. Lorsqu'un element est recherche et trouve dans la table, un pointeur sur la 
structure ENTRY correspondante est renvoye, contenant done le champ data initial. 



L'insertion ou la recherche se font avec la meme fonction hsearch( ) 

| ENTRY * hsearch (ENTRY element, ACTION action); 

ou 

int hsearch_r (ENTRY element, ACTION action, 

ENTRY ** retour, hsearch_data * table); 

pour la version reentrante. 

ACTION est un type enumere pouvant prendre les valeurs : 

• FIND : pour rechercher simplement l'element correspondant a la cle. hsearch( ) renvoie un 
pointeur sur l'element de la table ayant la cle indiquee, ou NULL s'il n'y a pas d'element 
enregistre avec cette cle. hsearch_r() fournit cette meme information dans l'argument 
retour, qui doit etre Fadresse d'un pointeur sur un enregistrement. Si la cle n'est pas 
trouvee, hsearch_r( ) renvoie une valeur nulle. 

• ENTER : pour enregistrer l'element ou mettre a jour son champ data s'il existe deja. La fonc- 
tion hsearchO renvoie un pointeur sur l'element ajoute ou mis a jour, ou NULL en cas 
d'echec a cause d'un manque de memoire. hsearch_r( ) fonctionne de la meme maniere et 
renvoie une valeur nulle en cas d'echec par manque de memoire. 

Nous allons mettre en pratique ces mecanismes avec un premier exemple qui va construire 
une table de hachage dont les enregistrements utilisent en guise de cle le libelle des jours de 
la semaine et des mois de l'annee en francais, et dont la partie data contient une chaine equi- 
valente en anglais. 

exemplejisearch.c : 

#include <search.h> 
#include <stdio.h> 
#include <string.h> 
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void 

ajoute_entree (char * francais, char * anglais) 
{ 

ENTRY entree; 

entree. key = strdup(francais) ; 

entree. data = strdup(anglais) ; 

if (hsearch(entree, ENTER) == NULL) { 

perror( "hsearch" ) ; 

exit(EXIT_FAILURE); 

} 



int 

main (int argc, char * argv[]) 
{ 

int i ; 

ENTRY entree; 

ENTRY * trouve; 

if (argc < 2) { 

fprintf (stderr, "Syntaxe : %s [mois | jour]\n", argv[0]); 
exit(EXIT_FAILURE); 

} 

/* 12 mois + 7 jours */ 
if (hcreate(19) == 0) { 

perror( "hcreate" ) ; 

exit(EXIT_FAILURE); 

} 



ajoute_ 


_entree( 


"janvier", 


"January" ) ; 


ajoute_ 


_entree( 


"fevrier" , 


"february" ) ; 


ajoute_ 


_entree( 


"mars" , 


"march" ) ; 


ajoute_ 


_entree( 


"avril " , 


"apri 1 " ) ; 


ajoute_ 


_entree( 


"mai " . 


"may" ) ; 


ajoute_ 


_entree( 


"juin" , 


"june") ; 


ajoute_ 


_entree( 


"jui 1 1 et" , 


"july"); 


ajoute_ 


_entree( 


"aout" , 


"august" ) ; 


ajoute_ 


_entree( 


"septembre" , 


"September" ) 


ajoute_ 


_entree( 


"octobre" , 


"October" ) ; 


ajoute_ 


_entree( 


"novembre" , 


"november" ) ; 


ajoute_ 


_entree( 


"decembre" , 


"december" ) ; 


ajoute_ 


_entree( 


"1 undi " , 


"monday") ; 


ajoute_ 


_entree( 


"mardi " , 


"tuesday" ) ; 


ajoute_ 


_entree( 


"mercredi " , 


"Wednesday" ) 


ajoute_ 


_entree( 


"jeudi " , 


"thursday" ) ; 


ajoute_ 


_entree( 


"vendredi " , 


"friday") ; 


ajoute_ 


_entree( 


"samedi " , 


"satursday" ) 


ajoute_ 


_entree( 


"dimanche" , 


"sunday" ) ; 



for (i =1; i < argc; i ++) { 
entree. key = argv[i]; 
fprintf (stdout, "%s -> ", argv[i]); 
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trouve = hsearchtentree, FIND); 
if (trouve == NULL) 

fprintf (stdout, "pas dans la liste \n"); 

el se 

fprintf (stdout, "£s\n", trouve->data) ; 

} 

hdestroy( ) ; 

return EXIT_SUCCESS; 

} 

L' execution du programme est conforme a nos attentes : 

$ ./exemple_hsearch jeudi 

jeudi -> thursday 

$ ./exemple_hsearch janvier juillet dimanche samstag 

janvier -> January 

juillet -> july 

dimanche -> Sunday 

samstag -> pas dans la liste 

$ 

Nous allons egalement mettre en ceuvre les extensions Gnu reentrantes, pour verifier le fonc- 
tionnement de ces routines. L'exemple suivant fonctionne comme le precedent, avec la liste 
des departements francais metropolitains. Nous forcons le pointeur char * data de la struc- 
ture ENTRY a etre manipule comme un int representant le numero du departement. 

exemplejisearchr.c : 

#define _GNU_SOURCE 
#include <search.h> 
#include <stdio.h> 
#include <string.h> 

void 

ajoute_entree (char * nom, int numero, struct hsearch_data * table) 
{ 

ENTRY entree; 
ENTRY * retour; 

entree. key = strdup(nom) ; 
entree. data = (char *) numero; 

if (hsearch_r(entree, ENTER, & retour, table) == 0) { 
perror( "hsearch_r" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

} 

int 

main (int argc, char * argv[]) 
{ 

struct hsearch_data table; 
int i; 
ENTRY entree; 
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ENTRY * trouve; 

if (argc < 2) { 

fprintf (stderr, "Syntaxe : %s nom-dept \n", argv[0]); 
exit(EXIT_FAILURE); 

} 

memset(& table, 0, sizeof(table)) ; 
if (hcreate_r(100, & table) == 0) { 

perror( "hcreate" ) ; 

exit(EXIT_FAILURE); 

} 



ajoute_ 


_entree("ain", 


1, 


\ table) 


ajoute_ 


_entree("aisne", 


2, 


1 table) 


ajoute_ 


_entree( "al 1 ier" , 


3, 


1 table) 


ajoute_ 


_entree( "al pes -de- haute- provence" ,4, 


1 table) 


ajoute_ 


.entree ( "hautes-al pes" , 


5, 


1 table) 


ajoute_ 


_entree( "essonne" , 


91, 


i table) 


ajoute_ 


_entree( "hauts-de-seine" , 


92, 


1 table) 


ajoute_ 


_entree( "seine-saint-deni s" , 


93, 


1 table) 


ajoute_ 


_entree( "val -de-marne" , 


94, 


1 table) 


ajoute_ 


_entree("val-d'oise", 


95, 


1 table) 


for (i 


= 1; i < argc; i ++) { 







entree. key = argv[i]; 
fprintf (stdout, "%s -> ", argv[i]); 
if (hsearch_r(entree, FIND, & trouve, & table) == 0) 
fprintf (stdout, "pas dans la liste \n"); 

el se 

fprintf (stdout, "£d\n", (int) (trouve->data)) ; 

} 

hdestroy_r(& tabl e) ; 
return EXIT_SUCCESS; 

} 

Le programme s'execute ainsi : 

$ ./exemple_hsearch_r essonne val-de-marne seine gironde 

essonne -> 91 

val-de-marne -> 94 

seine -> pas dans la liste 

gironde -> 33 

$ 

Recapitulatif sur les methodes d'acces aux donnees 

En definitive, nous avons vu plusieurs methodes de structuration des informations avec 
1' assistance de la bibliotheque C. Nous allons essayer de degager les avantages et les inconve- 
nients de chacune de ces techniques. II faut toutefois garder a l'esprit qu'une application bien 
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congue ne devra pas etre tributaire de telle ou telle organisation, mais pourra au contraire 
evoluer pour utiliser une structure mieux adaptee si le besoin s'en fait sentir. II est aise de 
regrouper dans un module distinct les appels aux routines de la bibliotheque C, en les enca- 
drant dans des fonctions generates d' initialisation de l'ensemble des donnees, d'ajout, de 
suppression et de recherche des elements. II est alors possible de changer de structure pour 
essayer d'ameliorer les performances sans avoir besoin d'intervenir sur le reste de l'applica- 
tion. Voici done un recapitulatif des methodes etudiees ici. 

Recherche lineaire, table non triee 

• Organisation extremement simple. Ajout et suppression d' elements tres faciles. 

• Performances interessantes lorsque les donnees sont peu nombreuses (quelques dizaines 
d'elements au maximum), et lorsqu'il y a de frequentes modifications du contenu de la 
table. 

• La fonction de comparaison ne doit pas necessairement foumir une relation d'ordre, mais 
simplement une egalite entre les elements ; F implementation peut done parfois etre opti- 
misee en ce sens. 

• En contrepartie, les performances sont tres mauvaises lorsque la taille de la table 
augmente, puisqu'il faut en moyenne balayer la moitie des elements presents. Une amelio- 
ration est toutefois possible si certaines donnees, peu nombreuses, sont reclamees tres 
frequemment. 

Recherche dichotomique, table triee 

• Acces tres rapide aux donnees, on n'effectue au maximum que log 2 (N) comparaisons pour 
trouver un element dans une table en contenant N. 

• L' ajout d'element est complique, puisqu'il faut utiliser une routine personnalisee ou retrier 
la table apres chaque insertion. 

• Les performances sont done optimales lorsque le nombre d'elements est important 
(plusieurs centaines), et si l'insertion de donnees est un phenomene rare. L'ideal est de 
pouvoir regrouper plusieurs insertions en un lot qu'on traite en une seule fois avant 
de retrier les donnees. 

Arbre binaire 

• Acces rapide aux donnees, de l'ordre de log 2 (N). L'insertion ou la suppression peuvent 
toutefois necessiter des reorganisations importantes de F arbre pour conserver l'equilibre. 

• Les possibilites de parcours automatique de F arbre peuvent permettre d'implementer auto- 
matiquement des algorithmes divers necessitant une exploration en profondeur d'abord. 
On peut aussi acceder aux donnees triees, dans le but de les sauvegarder dans un fichier par 
exemple. 

• Cette methode est done une alternative interessante par rapport aux tables triees et a la 
recherche dichotomique. La recherche peut etre legerement plus longue si Farbre n'est pas 
parfaitement equilibre, mais il est facile d'ajouter ou de supprimer des elements. 

Table de hachage 

• Principalement utilisee pour gerer des tables de chaines de caracteres qu'on desire retrou- 
ver rapidement. 
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• La taille de la table est fixee des sa creation et ne peut pas etre augmentee. Pour que cette 
methode soit vraiment efficace, la table doit etre suffisament grande pour eviter de 
depasser un taux de remplissage de 60 a 80 %. L' occupation memoire peut done etre 
import ante. 

• II n'est pas necessaire de fournir une fonction de comparaison, les cles sont des chaines de 
caracteres confrontees grace a strcmp( ). 

• II n'est pas possible de supprimer des elements dans une table de hachage ni de la balayer 
pour en sauvegarder le contenu dans un fichier par exemple. 

Conclusion 

Nous verrons a nouveau des mecanismes d' organisation plus ou moins similaires dans le 
chapitre consacre aux bases de donnees conservees dans des fichiers. 

Pour les lecteurs desireux d' approfondir le sujet des algorithmes de tri et voulant implementer 
eux-memes des versions modifiees, la reference reste probablement [Knuth 1973c] The Art 
of Computer Programming volume 3. On trouvera dans [Bentley 1989] Programming 
Pearls, des exemples montrant l'importance du choix d'un bon algorithme dans ce type de 
routines. 

Les concepts fondamentaux sont presentes dans [Hernert 2003] Les algorithmes. On pourra 
egalement trouver des idees interessantes dans [MlNOUX 1986] Graphes, algorithmes, logi- 
ciels. 

Nous terminons ainsi une serie de chapitres consacres a la gestion de la memoire d'un 
processus. Nous y avons etudie en detail le fonctionnement des mecanismes d'allocation et 
les possibilites de manipulation des chaines de caracteres et blocs de memoire. Nous retrou- 
verons quelques informations sur la memoire dans le chapitre consacre aux communications 
entre les processus, plus particulierement lorsque nous aborderons les segments de memoire 
partagee. 
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Nous avons deja aborde la notion de flux de donnees lors de la presentation des operations 
simplifiees d' entree-sortie pour un processus. Dans ce chapitre, nous allons etudier plus en 
detail la relation entre les flux de donnees et les descripteurs de fichiers qui leur sont associes. 

Nous verrons successivement les fonctions utilisees pour ouvrir ou fermer des flux, ainsi que 
les routines permettant d'y ecrire des donnees ou de s'y deplacer. 

Par la suite, nous examinerons la configuration des buffers associes a un flux, ainsi que les 
variables indiquant leur etat. 

Differences entre flux et descripteurs 

Une certaine confusion existe parfois dans 1' esprit des programmeurs debutants sous Unix en 
ce qui concerne les roles respectifs des flux de donnees et des descripteurs de fichiers. II s'agit 
pourtant de deux notions complementaires mais distinctes. 

Les descripteurs de fichiers sont des valeurs de type i nt, que le noyau associe a un fichier a la 
demande d'un processus. Ces entiers sont en realite des indices dans des tables propres a 
chaque processus, que le noyau est le seul a pouvoir modifier. Les descripteurs fournis par le 
noyau peuvent bien entendu etre associes a des fichiers reguliers, mais aussi a d'autres 
elements du systeme, comme des repertoires, des peripheriques accessibles par un fichier 
special, des moyens de communication comme les tubes {pipe) ou les files (FIFO) que nous 
etudierons ulterieurement, ou encore des sockets utilisees pour etablir la communication dans 
la programmation en reseau. 

Les flux de donnees sont des objets dont le type est opaque. C'est une structure aux champs 
de laquelle 1' application n'a pas acces. On manipule uniquement des variables pointeurs de 
type FILE *. Un flux est associe, en interne, a un descripteur de fichier, mais tout est masque 
au programmeur applicatif. Un flux dispose en plus du descripteur de fichier d'une memoire 
tampon, ainsi que de membres permettant de memoriser l'etat du fichier, notamment les even- 
tuelles erreurs survenues lors des dernieres operations. 
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II faut comprendre que les descripteurs de fichiers appartiennent a F interface du noyau. Les 
fonctions open( ), close( ), creatO, reacl( ), write ( ), fcntl ( ) par exemple sont des appels- 
systeme qui dialoguent done directement avec le noyau Linux. Les flux par contre sont une 
couche superieure ajoutee aux descripteurs et qui n'appartient qu'a la bibliotheque C. Les 
fonctions fopen( ), fcl ose( ), f read( ) ou fwrite( ) ne sont implementees que dans la biblio- 
theque C. Le noyau n'a aucune connaissance de la notion de flux. 

Ceci explique d'ailleurs que la bibliotheque d' entree-sortie du C Ansi standard ne comporte 
aucune indication concernant les descripteurs. Ceux-ci sont a Forigine specifiques aux 
systemes d' exploitation de type Unix et ne peuvent pas etre pris en consideration dans une 
normalisation generale. Pour assurer la portabilite d'un programme, on utilisera les flux, 
meme si la plupart des systemes d' exploitation courants implementent les fonctions d'acces 
aux descripteurs de fichiers (pas necessairement sous forme de primitives systeme d'ailleurs). 

La plupart du temps, le programmeur se tournera vers les flux de donnees pour manipuler des 
fichiers, ceci pour plusieurs raisons : 

• Portabilite : en effet, nous l'avons indique, les flux de donnees seront disponibles sur toutes 
les machines supportant le C standard. Ce n'est pas necessairement vrai pour les descrip- 
teurs de fichiers. 

• Performance : les flux utilisant des buffers pour regrouper les operations de lecture et 
d'ecriture, le surcout du a l'appel-systeme sur le descripteur sous-jacent est plus rare 
qu'avec une gestion directe du descripteur. 

• Simplicity : la large panoplie de fonctions d' entree et de sortie disponibles pour les flux 
n'existe pas pour les descripteurs de fichiers. Ceux-ci ne permettent que des lectures ou 
ecritures de blocs memoire complets. II n'existe pas F equivalent par exemple de la fonc- 
tion f gets ( ), qui permet de lire une ligne de texte depuis un flux. 

Les fonctions d' entree-sortie formatees, que nous avons deja rencontrees, comme fprintf ( ) 
ou f scanf ( ), fonctionnent directement sur des flux. Toutefois, on peut egalement les employer 
dans un programme traitant uniquement les descripteurs de fichiers, en utilisant une chaine de 
caracteres intermediate et en appelant sscanf ( ) ou sprintf ( ). 

Certaines fonctionnalites sont vraiment specifiques aux descripteurs de fichiers et ne peuvent 
pas etre appliquees directement sur les flux. C'est le cas de la fonction fcntl ( ), qui permet de 
parametrer des notions comme la lecture non bloquante, les fichiers conserves a travers un 
exec( ), etc. 

II est toujours possible d'obtenir le numero de descripteur associe a un flux, tout comme il est 
possible d'ouvrir un nouveau flux autour d'un descripteur donne. Le passage de Fune a 
F autre des representations des fichiers est done possible, bien qu'a eviter pour prevenir les 
risques de confusion. 

Nous etudierons done en premier lieu les fonctions permettant de manipuler les flux, puisque, 
en general, nous les prefererons aux descripteurs. 

Ouverture et fermeture d'un flux 

Nous avons deja vu un bon nombre de fonctions permettant d'echanger des donnees avec des 
flux, comme fgetcO, fgetsO, fprintf (), etc. Lorsque nous les avons rencontrees, nous 
n'utilisions que les trois flux predefinis stdin, stdout et stderr, ouverts par le systeme avant 
l'execution d'un processus. 
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Ouverture norma le d'un flux 

La fonction f open( ), declaree dans <stdi o . h> , permet d'ouvrir un nouveau flux a partir d'un 
fichier du disque : 

FILE * fopen (const char * nom, const char * mode); 

Cette fonction ouvre un flux a partir du fichier dont le nom est mentionne en premier argu- 
ment, avec les autorisations de lecture et/ou d' ecriture decrites dans une chaine de caracteres 
passee en second argument. 

Le nom du fichier peut contenir un chemin d'acces complet ou relatif. Un chemin commen- 
qant par le caractere 7' est pris en compte a partir de la racine du systeme de fichiers. Sinon, 
le chemin d'acces commence a partir du repertoire en cours. II faut noter que le caractere '-' 
representant le repertoire personnel d'un utilisateur, est un metacaractere du shell qui n'a 
aucune signification pour fopen (). Si on desire situer un fichier a partir du repertoire 
personnel de l'utilisateur, il faut interroger la variable d'environnement HOME. 

Notons egalement tout de suite qu'il n'est pas possible de retrouver le nom d'un fichier ouvert 
a partir du pointeur sur l'objet FILE (ni d'ailleurs a partir du descripteur sous-jacent). Si on 
desire garder une trace de ce nom, il faut le memoriser au moment de l'ouverture. 

Le mode indique en second argument permet de preciser le type d'acces desire. Le mode peut 
prendre l'une des valeurs indiquees dans le tableau suivant : 



Mode 


Type d'acces 


r 


Lecture seule, le fichier doit exister bien entendu. 


w 


Ecriture seule. Si le fichier existe deja, sa taille est ramenee a zero, sinon il est cree. 


a 


Ecriture seule en fin de fichier. Si le fichier existe, son contenu n'est pas modifie. Sinon, il est cree. 


r+ 


Lecture et ecriture. Le contenu precedent du fichier n'est pas modifie, mais les lectures et ecritures demar- 
reront au debut, ecrasant les donnees deja presentes. 


w+ 


Lecture et ecriture. Si le fichier existe, sa taille est ramenee a zero, sinon il est cree. 


a+ 




Ajout et lecture. Le contenu initial du fichier n'est pas modifie. Les lectures commenceront au debut du 
fichier, mais les ecritures se feront toujours en fin de fichier. 



Sur certains systemes non Unix, on peut rencontrer des lettres supplementaires comme 'b' 
pour indiquer que le flux contient des donnees binaires, et non du texte. Cette precision n'est 
d'aucune utilite sous Linux et n'a pas d'influence sur l'ouverture du flux. II existe egalement 
sur de nombreux systemes des restrictions de fonctionnement pour les flux ouverts en lecture 
et ecriture. Ces limitations n'ont pas cours sous Linux, mais nous les detaillerons, par souci 
de portabilite des applications, dans la section consacree au positionnement au sein d'un flux. 

II existe une extension Gnu de fopen ( ) qui permet d'ajouter un caractere 'x' a la fin du mode 
pour indiquer qu'on veut absolument creer un nouveau fichier. L'ouverture echouera si le 
fichier existe deja. Cette fonctionnalite n'est pas portable, mais elle peut parfois etre indispen- 
sable lorsque deux processus concurrents risquent de creer simultanement le meme fichier 
(un verrou par exemple). Le principe consistant a tenter une ouverture en lecture seule pour 
verifier si le fichier existe, suivie d'une reouverture en ecriture seule s'il n'existe pas ne fonc- 
tionne pas. En effet, ces deux operations doivent etre faites de maniere atomique, en un seul 
appel-systeme, sous peine de voir le noyau interrompre le processus entre les deux operations 
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pour autoriser F execution d'un processus concurrent qui creera egalement le meme fichier. 
Nous verrons qu'il y a un moyen d'ouvrir un descripteur de fichier en ecriture, uniquement si 
le fichier n'existe pas. On pourra alors utiliser cette methode pour ouvrir un flux autour du 
descripteur obtenu, afin d'implementer l'equivalent de l'extension Gnu V de fopen( ). 

La fonction fopen( ) renvoie un pointeur sur un flux, qu'on pourra ensuite utiliser dans toutes 
les fonctions d'entree-sortie. En cas d'echec, fopenO renvoie NULL, et la variable globale 
errno contient le type d'erreur, qu'on peut afficher avec perror( ). Voici quelques exemples 
d'ouverture de fichiers. 

exemplejopen.c : 

#include <stdio.h> 
#include <stdlib.h> 

void 

ouverture (char * nom, char * mode) 
{ 

FILE * fp; 

fprintf (stderr, "fopen(&s, %s) : ", nom, mode); 
if ((fp = fopen(nom, mode)) == NULL) { 

perror( " " ) ; 
} else { 

fprintf (stderr, "Ok\n"); 

fclose(fp) ; 

} 

} 

int 
main (void) 
{ 

ouverture ( "/etc/in i ttab" , "r" ) ; 
ouverture ( "/etc/in i ttab" , "w" ) ; 
ouverture( "essai .fopen" , "r") ; 
ouverture( "essai .fopen" , "w") ; 
ouverture( "essai .fopen" , "r") ; 
return EXIT_SUCCESS; 

} 

La lecture du fichier /etc/inittab est autorisee pour tous les utilisateurs sur les distributions 
Linux classiques, par contre F ecriture est reservee a root. Le fichier essai .fopen n'existe pas 
avant F execution du programme. II est cree lors de l'ouverture en mode w, ce qui explique que 
la seconde tentative d'ouverture en lecture reussisse. 

$ . /exempt e_f open 

fopen(/etc/inittab, r) : Ok 

fopen(/etc/inittab, w) : Permission non accordee 

fopen(essai .fopen, r) : Aucun fichier ou repertoire de ce type 

fopen(essai .fopen, w) : Ok 

fopen(essai .fopen, r) : Ok 

$ 1 s essai .* 

essai .fopen 

$ rm essai .fopen 

$ 
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On notera que le nombre de fichiers simultanement ouverts par un processus est limite. Cette 
restriction est decrite par une constante symbolique 0PEN_MAX. Celle-ci inclut les trois flux 
predefinis : stdin, stdout et stderr. Sous Linux, avec la GlibC, elle vaut 1024. 

Fermeture d'un flux 

La fermeture d'un flux s'effectue a l'aide de la fonction fclose( ), dont le prototype est : 
| int fclose (FILE * flux); 

Une fois que le flux est ferme, une tentative d' ecriture ou de lecture ulterieure echouera. Le 
buffer alloue par la bibliotheque C lors de Fouverture est libere. Par contre, le buffer qu'on 
peut avoir explicitement installe avec la fonction settmf ( ) ou ses derives, que nous verrons 
plus bas, n'est pas libere. La fonction fclose ( ) renvoie 0 si elle reussit ou EOF si une erreur 
s'est produite. 

II est important de verifier la valeur de retour de f cl ose( ) , au meme titre que toutes les ecri- 
tures dans un fichier. En effet, avec le principe des ecritures differees, le buffer associe a un 
flux n'est reellement ecrit dans le fichier qu'au moment de sa fermeture. Une erreur peut alors 
se produire si le disque est plein ou si une connexion reseau est perdue (systeme de fichiers 
NFS par exemple). Une autre erreur peut se produire avec certains types de systemes de 
fichiers, comme ext3, si un probleme d' entree-sortie apparait sur une partition, qui est alors 
remontee automatiquement en lecture seule. Notre flux initialement ouvert en ecriture renvoie 
une erreur « disque plein » au moment de la fermeture. 

Si la fonction fclose ( ) signale une erreur, le flux n'est plus accessible, mais il est toujours 
possible de prevenir l'utilisateur qu'un probleme a eu lieu et qu'il peut reiterer la sauvegarde 
apres avoir arrange la situation. On peut analyser la variable globale errno pour diagnostiquer 
le probleme, les erreurs possibles etant les memes que pour l'appel-systeme wri te( ) que nous 
verrons plus loin. 

On peut egalement fermer tous les flux ouverts par un processus avec la fonction f cl oseall ( ) 
qui est une extension Gnu declaree dans <stdi o . h> : 

int fcloseall (void) ; 

Normalement, tous les flux sont fermes a la fin d'un processus, mais dans certains cas - arret 
abrupt a cause d'un signal par exemple - les buffers de sortie peuvent ne pas etre ecrits effec- 
tivement. II est alors possible d'appeler f cl oseal 1 ( ) dans le gestionnaire de signaux concerne 
avant d'invoquer abort(). 

Presentation des buffers associes aux flux 

II est temps d'etudier plus precisement les buffers associes aux flux, car ils sont souvent 
source de confusions. 

II existe, lors d'une ecriture dans un flux, trois niveaux de buffers susceptibles de differer 
l'ecriture. Tout d'abord, le flux est lui-meme l'association d'une zone tampon et d'un descrip- 
teur de fichier. II est possible de parametrer le comportement de ce buffer au moyen de 
plusieurs fonctions que nous verrons un peu plus loin. On peut aussi forcer l'ecriture du 
contenu d'un buffer en utilisant la fonction f f 1 ush( ) , declaree ainsi : 

| int fflush (FILE * flux); 
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Avec cette fonction, la bibliotheque C demande au noyau d'ecrire le contenu du buffer 
associe au flux indique. Elle renvoie 0 si elle reussit et EOF en cas d'erreur. Les erreurs sont 
celles qui peuvent se produire en invoquant l'appel-systeme write ( ). 



Attention 

La fonction f f 1 ush ( ) n'a d'effet que sur les flux utilises en ecriture. II est totalement illusoire de tenter d'invo- 
quer ffl ush(stdin) , par exemple. Cet appel, malheureusement frequemment rencontre, n'a aucune 
utilite et peut meme declencher une erreur sur certains systemes (pas avec la GlibC toutefois). 



Lorsqu'on appelle ffl ush( ), la bibliotheque C invoque alors l'appel-systeme write( ) sur les 
donnees qui n'etaient pas encore transmises. Ceci se produit egalement lorsqu'on ferme le 
flux ou lorsque le buffer est plein (ou encore en fin de ligne dans certains cas). Nous revien- 
drons sur ces details. 

Lorsqu'un processus se termine, nous sommes done assure que le noyau a recu toutes les 
donnees que nous desirions ecrire dans le fichier. Les fonctions ffl ush () et fcloseO elimi- 
nent done tout risque d'ambiguite si deux processus tentent d'acceder simultanement au 
meme fichier, puisque le noyau s'interpose entre eux pour assurer la coherence des donnees 
ecrites d'un cote et lues de 1' autre. 

Toutefois, un deuxieme niveau de buffer intervient a ce moment. Le noyau en effet imple- 
mente un mecanisme de memoire cache pour limiter les acces aux disques. Ce mecanisme 
varie en fonction des systemes de fichier utilises (et des attributs des descripteurs de fichiers). 
En regie generale, le noyau differe les ecritures le plus longtemps possible. Ceci permet 
qu'une eventuelle modification ulterieure du meme bloc de donnees n'ait lieu que dans la 
memoire centrale, en evitant toute la surcharge due a une sequence lecture-modification- 
ecriture sur le disque. 

Pour s' assurer que les donnees sont reellement envoyees sur le disque, le noyau offre un 
appel-systeme syncO. 

int sync (void) ; 

Celui-ci transmet au controleur du disque les blocs de donnees modifies depuis leur derniere 
ecriture reelle. Sur d'autres systemes Unix, l'appel-systeme sync( ) garantit uniquement que 
le noyau va commencer a mettre a niveau ses buffers, mais revient tout de suite. Depuis la 
version 2.0 de Linux, l'appel reste bloquant tant que tous les blocs n'ont pas ete transmis sur 
le disque. II existe un utilitaire /bin/sync qui sert uniquement a invoquer l'appel-systeme 
sync( ). Sur les anciens Unix, on utilisait classiquement la sequence sync; sync ; sync dans les 
scripts d' arret de la machine pour etre a peu pres stir que tous les blocs en attente soient ecrits 
sur le disque. Sous Linux, un seul appel a /bi n/sync suffit. 

Le noyau nous assure done que lorsqu'un systeme de fichiers est demonte ou lorsque sync( ) 
revient, tous les blocs en attente auront ete transmis au disque. Malheureusement, certains 
controleurs de disques (principalement SCSI) disposent de buffers internes tres grands (des 
centaines de Mo), et rien ne garantit que les donnees soient immediatement ecrites physique- 
ment. Ce point doit etre pris en consideration lors de la conception de systemes informatiques 
bases sur des machines Linux avec des donnees critiques (gestion repartie, supervision de 
systemes industriels ou scientifiques). On pourra alors utiliser une alimentation secourue ou 
des ordinateurs portables sur batterie pour garantir un certain laps de temps pour la sauve- 
garde physique des donnees en cas de defaillance secteur. 
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La fonction fflushO que nous avons vue ci-dessus peut egalement etre employee avec un 
argument NULL. Dans ce cas, elle vide les buffers de tous les flux en attente d' ecriture. 



Ouvertures particulieres de flux 

La fonction f open( ) dispose de deux variantes permettant d'ouvrir un flux de deux manieres 
legerement differentes. La premiere fonction est fdopen( ), dont le prototype est : 

FILE * fdopen (int descripteur, const char * mode); 

Cette fonction permet de disposer d'un flux construit autour d'un descripteur de fichier deja 
obtenu auparavant. Ce descripteur doit avoir ete fourni precedemment par Fun des appels- 
systeme suivants : 

• openO, creat( ), ouvrant un fichier disque. 

• pi pe ( ) , qui cree un tube de communication entre processus. 

• socket ( ) , permettant d'etablir une liaison reseau. 

• dup( ), dup2( ) , qui servent a dupliquer un descripteur existant. 

Nous detaillerons ces fonctions dans les chapitres a venir. Ce qu'il faut retenir pour le 
moment c'est la possibility de creer un flux a partir de toutes les sources de communication 
offertes par le noyau Linux. 

Le mode indique en second argument doit etre compatible avec les possibilites offertes par le 
descripteur existant. Plus particulierement, si le mode reclame necessite des acces en ecriture, 
ceux-ci doivent etre possibles sur le descripteur fourni. II faut remarquer egalement que les 
modes w ou w+ ne permettent pas dans ce cas de ramener a zero la taille du fichier associe, car 
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celui-ci est deja ouvert par le descripteur. Rappelons aussi que ce descripteur n'est pas neces- 
sairement associe a un fichier, et que la modification de taille d'une socket reseau par exemple 
n'aurait pas de sens. 

En cas d'echec, fdopen( ) renvoie NULL, sinon elle transmet un pointeur sur le flux desire. 

Cette fonction est done principalement utile pour acceder sous forme de flux a des sources de 
donnees qu'on ne peut pas obtenir par un fopen( ) classique, comme les tubes ou les sockets. 
Nous en verrons plusieurs exemples dans le chapitre 28. 

La seconde fonction derivee de fopen( ) est f reopen ( ), dont le prototype est le suivant : 

FILE * freopen (const char * fichier, const char * mode, FILE * flux); 

Cette fonction commence par fermer le flux indique en dernier argument, en ignorant toute 
erreur susceptible de se produire. Ensuite, elle ouvre le fichier demande, avec le mode precise 
en second argument, en utilisant le meme flux que le precedent. Un pointeur sur ce dernier est 
renvoye, ou NULL en cas d' erreur. 

Etant donne que f reopen ( ) ne verifie pas les erreurs susceptibles de se produire en fermant le 
flux original, il est indispensable d'appeler f f 1 ush( ) - et de surveiller sa valeur de retour - si 
le flux original a servi au prealable a ecrire des donnees. 

Linteret principal de cette fonction est de pouvoir rediriger les flux standard stdin, stdout et 
stderr depuis ou vers des fichiers, au sein meme du programme. Tous les affichages sur 
stderr par exemple pourront ainsi etre envoyes vers un fichier de debogage, sans redirection 
au niveau du shell. II est aussi possible de rediriger stderr vers /dev/null pour supprimer 
tous les messages de diagnostic par exemple, bien que d'autres methodes comme syslogt ) 
soient largement preferables. Voici un exemple de programme ou on redirige la sortie stan- 
dard du processus. 

exemplejreopen.c : 

#include <stdio.h> 

int 
main (void) 
{ 

fprintf (stdout, "Cette ligne est envoyee sur la sortie normale \n"); 
if (freopenCessai .freopen" , "w", stdout) == NULL) { 

perror( "freopen" ) ; 

exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Cette ligne doit se trouver dans le fichier \n"); 
return EXIT_SUCCESS; 

} 

La premiere ecriture sur stdout se trouve normalement affichee sur la sortie standard, la 
seconde est redirigee vers le fichier desire. 

$ ./exemple_f reopen 

Cette ligne est envoyee sur la sortie normale 
$ cat essai .freopen 

Cette ligne doit se trouver dans le fichier 

$ rm essai .freopen 

$ 
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On notera que, les descripteurs de fichiers correspondant aux flux herites au cours d'un appel 
fork( ), la redirection est toujours valable pour le processus fils. 

Avec la bibliotheque GlibC, les flux stdin, stdout et stderr sont des variables globales. II 
serait done tout a fait possible d'ecrire : 

fcl ose(stdout) ; 

if ((stdout = fopen( "essai .freopen", "w")) == NULL) { 
perror( "fopen" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

Toutefois ce ne serait pas portable car de nombreuses implementations de la bibliotheque C 
standard definissent stdin, stdout et stderr sous forme de macros. II est done indispensable 
d'utiliser f reopen ( ) dans ce cas. 



Lectures et ecritures dans un flux 

Nous avons vu comment ouvrir, refermer les flux, et vider les buffers associes. II est mainte- 
nant necessaire d'etudier les fonctions servant a ecrire effectivement ou a lire des donnees. 

L'essentiel des fonctions d'entree-sortie sur un flux a deja ete etudie dans le chapitre 10. Nous 
y avons vu successivement fpri ntf ( ), vfpri ntf ( ), fputc( ), fputs( ) pour les ecritures, fgetct ), 
fgets( ), fscanf ( ) et vfscanf ( ) pour les lectures, ainsi que fungetc( ) pour rejeter un carac- 
tere dans un flux. 

Nous allons ici nous interesser aux fonctions dites d'entree-sortie binaires. Celles-ci permet- 
tent de lire ou d'ecrire le contenu integral d'un bloc memoire, sans se soucier de son interpre- 
tation. La fonction d'ecriture est fwrite( ) , dont le prototype est le suivant : 

int fwrite (const void * bloc, 

size_t taille_elements, 
size_t nb_elements, 
FILE *flux)j 

Elle permet d'ecrire dans le flux indique un certain nombre d'elements consecutifs, dont on 
indique la taille et l'adresse de depart. Pour sauvegarder le contenu d'une table d'entiers par 
exemple, on pourra utiliser : 

int tabl e[NB_ENTIERS] ; 
[...] 

fwrite(table, sizeof(int), NB_ENTI ERS , fichier); 

Cette fonction renvoie le nombre d'elements correctement ecrits. Si cette valeur differe de 
celle qui est transmise en troisieme argument lors de l'appel, une erreur s'est produite, qui 
doit etre diagnostiquee a l'aide de la variable globale errno. Generalement, une telle erreur 
sera critique et correspondra a un probleme de disque sature ou de liaison perdue avec un 
systeme de fichiers NFS distant. Toutefois, il peut arriver que 1' erreur soit benigne, si le flux a 
ete ouvert par la fonction fdopen( ) autour d'une socket de connexion reseau ou d'un tube de 
communication. Dans ces deux cas en effet, les ecritures peuvent etre bloquantes tant que le 
recepteur n'est pas disponible, et un signal peut interrompre l'appel-systeme write( ) sous- 
jacent. A cette occasion, il sera possible de reiterer l'appel de la fonction, avec les elements 
non ecrits correctement. 
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La fonction symetrique freadO permet de lire le contenu d'un flux et de Pinscrire dans un 
bloc de memoire. Son prototype est : 

int fread (void * bloc, 

size_t taille_elements, 
size_t nb_elements, 
FILE * flux); 

Les arguments de f read( ) sont identiques a ceux de fwrite( ). A ce propos, on notera que ces 
prototypes sont une source frequente d'erreurs a cause de la position du pointeur FILE * en 
dernier argument, contrairement aux fonctions f pri ntf ( ) et f scanf ( ) qui le placent en premier. 
Le problems est que F inversion entre le pointeur sur le flux et celui sur le bloc peut etre ignoree 
par le compilateur si certains avertissements sont desactives. De toute maniere, il est difficile 
de se souvenir sans erreur des positions respectives de la taille des elements et de leur nombre. 
Aussi, on s'imposera comme regie avant chaque utilisation de f read ( ) ou de fwri te ( ) de jeter 
un coup d'ceil rapide sur leurs pages de manuel freadO) dans une fenetre Xterm annexe. 

Comme pour fwriteO, la valeur de retour de freadO correspond au nombre d'elements 
correctement lus. Par contre, a P inverse de fwriteO, le nombre effectivement lu peut etre 
inferieur a celui qui est reclame, sans qu'une erreur critique ne se soit produite, si on atteint la 
fin du fichier par exemple. 

Ces fonctions sont tres utiles pour sauvegarder des tables de donnees, des structures, a condi- 
tion qu'on ne les reutilise que sur la meme machine. Les donnees ecrites sont en effet une 
reproduction directe de la representation des informations en memoire. Cette representation 
peut varier non seulement entre deux systemes differents, par exemple en fonction de Pordre 
des octets pour stocker des entiers, mais aussi sur la meme machine en fonction des options 
utilisees par le compilateur. En voici un exemple : 

exemple_enum.c : 

#i include <stdio.h> 

typedef enum { 

un, deux, trois 
} enum_t; 

int 
main (void) 
{ 

fprintf (stdout, "sizeof (enum_t) = %d\n" , sizeof (enum_t)); 
return EXIT_SUCCESS; 

} 

En fonction des options de compilation de gcc, la taille des donnees de type enumere varie : 

$ cc -Wall exemple_enum.c -o exemple_enum 
$ ./exemple_enum 

sizeof (enum_t) = 4 

$ cc -Wall exemple_enum.c -o exemple_enum -fshort-enums 
$ ./exemple_enum 

sizeof (enum_t) = 1 
$ 
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II faut done etre tres prudent avec Templed des fonctions fread( ) et fwrite( ), et ne les consi- 
derer que comme des moyens de sauvegarder et de recuperer des donnees sur une seule et 
meme machine, sans perennite dans le temps. 

II est conseille dans toute application importante de prevoir des fonctionnalites d' exportation 
et d'importation des donnees moins rapides que les acces binaires directs, employant des 
fichiers plus volumineux mais transferables entre plusieurs systemes hotes ou entre diverses 
versions de la meme application. Pour cela le plus simple est d' employer une representation 
textuelle, en utilisant les fonctions fprintf ( ) et fscanf ( ) pour ecrire et relire les donnees. Le 
meilleur exemple de cette politique est probablement le format de fichier DXF qui sert a 
exporter des dessins issus du logiciel AutoCad. Ce format, documente par l'editeur Autodesk, 
represente les donnees sous forme de textes Ascii, done lisibles sur l'essentiel des machines 
actuelles. II est ainsi tres utilise dans les applications servant a visualiser des plans, des synop- 
tiques, etc. Par contre, AutoCad utilise en interne un format personnel DWG, non documente 
et ne permettant pas le transfert entre machines. 

Nous allons quand meme presenter un exemple d' utilisation de freadO et de fwriteO, 
sauvegardant le contenu d'une table de structures representant des points dans l'espace. La 
table est initialisee avec les points situes aux sommets d'un cube centre sur l'origine. Nous 
sauvegardons la table, la rechargeons, et affichons les coordonnees pour verifier le fonction- 
nement. 

exemple_fwrite.c : 

#include <stdio.h> 
#include <stdlib.h> 

typedef struct { 

double x; 

double y; 

double z; 
} point_t; 

int 
main (void) 

{ 

point_t * table; 
int n; 
int i; 
FILE * fp; 

n = 8; 

table = calloc(n, sizeof (point_t)) ; 
if (table == NULL) { 

perror( "cal 1 oc" ) ; 

exi t( EXIT_FAI LURE) ; 

} 

/* Initialisation */ 

table[0].x = -1.0; table[0].y = -1.0; table[0].z 
tabled]. x = 1.0; tabled]. y = -1.0; tabled]. z 
table[2].x = -1.0; table[2].y = 1.0; table[2].z 



= -1.0 
= -1.0 
= -1.0 
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table[3] 


x = 


1 


0 


table[3] 


y = 


l 


0 


table[3] 


z = 


-1 


0 


table[4] 


x = 


-1 


0 


table[4] 


y = 


-l 


0 


table[4] 


z = 


1 


0 


table[5] 


X = 


1 


0 


table[5] 


y = 


-l 


0 


table[5] 


z = 


1 


0 


table[6] 


X = 


-1 


0 


table[6] 


y = 


l 


0 


table[6] 


z = 


1 


0 


table[7] 


X = 


1 


0 


table[7] 


y = 


l 


0 


table[7] 


z = 


1 


0 



/* Sauvegarde */ 



if ((fp = fopen( "essai . f read" , "w")) == NULL) { 
perrort "fopen" ) ; 
exit(EXIT_FAILURE); 

} 

/* Ecriture du nombre de points, suivi de la table */ 
if ((fwrite(& n, sizeof(int), 1, fp) != 1) 
|| (fwrite(table, sizeof (point_t) , 8, fp) != 8)) { 

perrorCfwrite"); 

exit(EXIT_FAILURE); 

} 

fclose(fp) ; 
f reettabl e) ; 
table = NULL; 
n = 0; 

/* Recuperation */ 

if ((fp = fopenCessai .fread", "r")) == NULL) { 
perror( "fopen" ) ; 
exit(EXIT_FAILURE); 

} 

if (fread(& n, sizeof(int), 1, fp) ! = 1) { 
perror( "fread" ) ; 
exit(EXIT_FAILURE); 

} 

if ((table = calloctn, sizeof (point_t) ) ) == NULL) { 
perrorC'calloc"); 
exit(EXIT_FAILURE); 

} 

if (fread(table, sizeof (point_t) , n, fp) != 8) { 
perror( "fread" ) ; 
exit(EXIT_FAILURE); 

} 

fclose(fp) ; 

/* Affichage */ 

for (i = 0; i < n; i ++) 

fprintf(stdout, "pointed] : % f, % f . % f \n", 
i, tabled"]. x, tabled']. y, tabled"]. z); 
return EXIT_SUCCESS; 

} 

Comme on peut s'y attendre, l'execution donne : 
$ ./exemple_f write 

point[0] : -1.000000, -1.000000, -1.000000 
point[l] : 1.000000, -1.000000, -1.000000 
point[2] : -1.000000, 1.000000, -1.000000 
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point[3] 
point[4] 
point[5] 
point[6] 
point[7] 
$ 

On remarquera au passage l'emploi d'un caractere d'espacement entre le '%' et le 'f du 
format de fprintf ( ), ce qui permet de conserver l'alignement des donnees en affichant un 
espace avant les valeurs positives. 

II existe deux anciennes fonctions, getw( ) et putw( ) , qu'on peut considerer comme obsoletes, 
permettant de lire ou d'ecrire un entier. Leurs prototypes sont : 

int getw (FILE * flux); 

et 

int putw (int entier, FILE * flux); 

Ces fonctions renvoient EOF en cas d'echec. Sinon, elles transmettent respectivement la valeur 
lue et 0. Le gros defaut avec getw( ) est qu'il est impossible de distinguer une erreur de la 
lecture effective de la valeur EOF (qui vaut generalement -1). II est done preferable de 
remplacer ces deux fonctions par f read( ) et fwrite( ). 



1.000000, 
-1.000000, 

1.000000, 
-1.000000, 

1.000000, 



1.000000, 
-1.000000, 
-1.000000, 
1.000000, 
1.000000, 



-1.000000 
1.000000 
1.000000 
1.000000 
1.000000 



Positionnement dans un flux 

II est rare dans une application un tant soit peu complexe qu'on ait uniquement besoin de lire 
les donnees d'un fichier sequentiellement, du debut a la fin, sans jamais revenir en arriere ou 
sauter des portions d' informations. II est done naturel que la bibliotheque C mette a notre 
disposition des fonctions permettant de se deplacer librement dans un fichier avant de lire son 
contenu ou d'y ecrire des donnees. 

Ceci est gere en fait directement au niveau du descripteur de fichier, par le noyau, en memori- 
sant la position a laquelle se fera le prochain acces dans le fichier. Cette position est mise a 
jour apres chaque lecture ou ecriture. 

II existe trois types de fonctions pour consulter ou indiquer la position dans le fichier : le 
couple f tel 1 ( ) / f seek( ), qui oblige l'indicateur de position a etre de type 1 ong i nt, le couple 
f tel 1 o( ) / f seeko( ), qui fonctionne de maniere similaire mais sans cette restriction de type, 
et enfin f getpos ( ) / f setpos ( ), qui sont encore plus portables. 

Si la plupart des flux obtenus par fopen( ) depuis un fichier disque ne posent aucun probleme 
de positionnement, ce n'est toutefois pas le cas de tous les flux possibles. Un certain nombre 
de sources de donnees sont fondamentalement sequentielles, et il n'est pas possible de se 
deplacer en leur sein. Tel est par exemple le cas d'un tube de communication entre processus. 
On ne peut y avancer qu'en lisant les donnees, et on ne peut en aucun cas reculer la position 
de lecture. Le meme phenomene se produit avec les sockets de liaison reseau ou les fichiers 
speciaux d' acces aux peripheriques. Avec de tels flux, toute tentative de consultation ou de 
modification de la position courante echouera. 
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Positionnement classique 

Les fonctions les plus simples d'acces aux positions sont certainement ftellO et fseekO, 
dont les prototypes sont : 

long ftell (FILE * flux); 

et 

int fseek (FILE * flux, long position, int depart); 

La fonction f tel 1 ( ) transmet la position courante dans le flux, mesuree en octets depuis le 
debut du fichier. Si le positionnement n'est pas possible sur ce type de flux, ftel 1 ( ) 
renvoie -1. 

La fonction f seek( ) permet de se deplacer dans le fichier. La position est indiquee en octets, 
depuis le point de depart fourni en troisieme argument. Celui-ci peut prendre les valeurs 
suivantes : 

• SEEK_SET (0) : on mesure la position depuis le debut du fichier. 

• SEEK_CUR (1) : le deplacement est indique a partir de la position courante dans le fichier. 

• SEEK_END (2) : la position est mesuree par rapport a la fin du fichier. 

Nous avons exceptionnellement indique entre parentheses les valeurs des constantes symboli- 
ques definies dans <stdi o . h>. En effet, ces constantes ne sont apparues que relativement tard, 
et de nombreuses applications Unix contiennent ces valeurs codees en dur dans leurs fichiers 
source. On peut egalement rencontrer les constantes obsoletes L_SET, L_I NCR, L_XTND, qui sont 
des equivalentes BSD de SEEK_J>ET, SEEK_CUR et SEEK_END, definies par souci de compatibilite 
dans <sys/file.h>. 

La fonction f seek( ) renvoie 0 si elle reussit, et -1 en cas d'echec. 

La fonction rewi nd( ) permet de ramener la position courante au debut du flux. Son prototype 
est : 

void rewind (FILE * fp) ; 
On pourrait la definir en utilisant f seek (fichier, 0, SEEK_SET). 

Lorsque f seek( ) ou rewi nd( ) sont invoquees, le contenu eventuel du buffer de sortie associe 
au flux est ecrit dans le fichier avant le deplacement. II existe d'ailleurs sur de nombreux 
systemes une restriction a Futilisation d'un flux en lecture et ecriture. Sur de tels systemes, 
une lecture ne peut suivre une operation d'ecriture que si on a invoque fflushO, fseekO, 
fseeko( ), fsetpos( ) ou rewind( ) entre les deux operations. De meme, avant une ecriture qui 
suit une lecture, il faut obligatoirement invoquer fseekO, fseekoO, fsetpost) ou rewindO. 
Meme lorsque l'ecriture doit avoir lieu exactement a la position courante resultant de la 
derniere lecture, il faut employer fseek(fichier, 0, SEEK_CUR). 

Ces limitations n'ont pas cours sous Linux. Toutefois, si un programme utilise un flux en 
lecture et ecriture, il sera bon, par souci de portability, d'indiquer par un commentaire dans le 
fichier source les points ou un f seek( ) serait obligatoire, voire de l'incorporer effectivement. 
II est beaucoup plus simple de marquer ces emplacements lors de la creation initiale du 
programme, alors qu'on maitrise parfaitement Futilisation du flux en question, que de recher- 
cher, lors d'un portage, toutes les operations ayant lieu sur le fichier, et d' analyser leur orga- 
nisation pour trouver ou placer les synchronisations obligatoires. 
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Notre premier exemple va employer ftel 1 ( ) pour reperer l'emplacement des caracteres de 
retour a la ligne '\n', et afficher les longueurs successives des lignes. Nous analyserons le 
contenu de F entree standard afin de voir directement certains cas d'echec. 

exemplejtell.c : 

#include <stdio.h> 

int 
main (void) 

{ 

long derniere; 
long position; 
int caractere; 

position = ftel 1 (stdin) ; 
if (position == -1) { 

perror( "ftel 1 " ) ; 

exi t( EXIT_FAI LURE) ; 

} 

derniere = position; 

while ((caractere = getcharO) != EOF) { 
if (caractere == '\n') { 
position = ftell (stdin) ; 
if (position == -1) { 
perror( "ftel 1 " ) ; 
exi t(EXIT_FAI LURE); 

} 

fprintf (stdout, "£ld ", position - derniere - 1); 
derniere = position; 

} 

} 

fprintf (stdout, "\n"); 
return EXIT_SUCCESS; 

} 

Nous allons essayer de l'executer successivement a partir d'un fichier, depuis un tube cree par 
le pipe ' | ' du shell et depuis un fichier special de peripherique. 

$ ./exemple_ftell < exempl e_f tel 1 .c 

0 19 0 4 11 1 15 15 15 1 26 22 19 10 2 21 42 0 26 28 24 21 13 4 53 23 3 2 24 12 1 

$ cat exempl e_ftel 1 .c | . /exempl e_f tell 

ftel 1 : Reperage i 1 1 egal 

$ . /exempl e_f tell < /dev/tty 

ftel 1 : Reperage i 1 1 egal 

$ 

Nous voyons que les flux obtenus a partir d'un tube ou d'un fichier special de peripherique ne 
permettent pas le positionnement. 
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Positionnement compatible Unix 98 

Le defaut des fonctions f seek( ) et ftel 1 ( ) est de restreindre la taille d'un fichier a celle d'un 
1 ong. Actuellement, sous Linux, un 1 ong i nt est implemente a Faide 4 octets. Ce qui signifie 
que la taille d'un fichier est limitee a 2 31 - 1 octets (un bit est reserve pour le signe) correspon- 
dant a 2 Go. Cette dimension paraissait enorme il y a encore quelque temps, mais comme la 
taille des disques est regulierement decuplee, des fichiers de 2 Go deviennent tres envisa- 
geables pour stocker des sequences d' images numeriques, des enregistrements sonores, ou 
encore des bases de donnees importantes. 

Pour passer outre la limitation de f seek( ) et de ftel 1 ( ) , les specifications Unix 98 ont intro- 
duit deux nouvelles fonctions, fseeko( ) et ftel 1 o( ), utilisant un type de donnees specifique, 
off_t. Par defaut, avec la GlibC, ce type est encore equivalent a un long i nt, mais il pourra 
etre etendu suivant les evolutions du systeme. 

Pour que ces fonctions soient disponibles, il faut que la constante symbolique _X0PEN_S0URCE 
soit initialisee avec la valeur 500 avant d'inclure <stdi o . h>. 

Les prototypes de ces nouvelles fonctions sont : 
off_t ftel lo (FILE * flux); 

int fseeko (FILE * flux, off_t position, int depart); 

Leur fonctionnement est exactement le meme que ftel 1 ( ) et f seek( ), au type of f_t pres. 

Nous allons creer un programme de demonstration qui servira a retourner integralement le 
contenu d'un fichier. Celui-ci va uniquement utiliser des primitives fseekoO, ftelloO, 
fgetc( ) et fputc( ). Rappelons que nous en avons deja construit une version bien plus efficace 
a l'aide de mmap( ) dans le chapitre consacre a la gestion de l'espace memoire d'un processus. 

exemplejseeko.c : 

//define _X0PEN_SOURCE 500 
#include <stdio.h> 
#include <stdlib.h> 

int 

main (int argc, char * argv[]) 
{ 

int i ; 

FILE * fp; 

int caractere; 

int echange; 

off_t debut; 

off_t fin; 

if (argc < 2) { 

fprintf (stderr, "syntaxe : %s fichier. . .\n", argv[0]); 
exit(EXIT_FAILURE); 

} 

for (i =1; i < argc ; i ++) { 

if ((fp = fopen(argv[i], "r+")) == NULL) { 

fprintf (stderr, "%s inaccessible \n", argv[i]); 
continue; 

} 
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if (fseektfp, 0, SEEK_END) != 0) { 

fprintf (stderr, "%s non positionnable \n", argv[i]); 

fcl ose(fp) ; 

continue; 

} 

fin = ftell(fp) - 1; 
debut = 0; 

while (fin > debut) ( 

if (fseektfp, fin, SEEK_SET) != 0) 

break; 
caractere = fgetc(fp); 
if (fseektfp, debut, SEEK_SET) != 0) 

break; 
echange = fgetc(fp) ; 
if (fseektfp. debut, SEEK_SET) != 0) 

break; 
fputctcaractere, fp); 
if (fseektfp, fin, SEEK_SET) != 0) 

break; 
fputctechange, fp); 
fin --; 
debut ++; 

} 

fcl ose(fp) ; 

} 

return EXIT_SUCCESS; 

} 

Nous utilisons deux pointeurs qui se rapprochent l'un de l'autre a chaque iteration pour eviter 
d'avoir a s'interroger sur le point d'arret au milieu du fichier en fonction de la parite de la 
dimension du fichier. Nous executons le programme en lui demandant de retourner son propre 
fichier source (on reconnait les mots-cles return, fclose, int, etc., a l'envers). 

$ ./exemple_fseeko ./exemple_fseeko.c 
$ cat exemple_fseeko.c 

} 

;SSECCUS_TIXE nruter 
} 

;)pf( esolcf 

[...] 
tni 

>h.bildts< edulcni# 

>h.oidts< edulcni# 

005 ECRU0S_NEP0X_ enifed* 

$ ./exemple_fseeko ./exemple_fseeko.c 

$ cat exemple_fseeko.c 
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#define _X0PEN_S0URCE 500 
#include <stdio.h> 
#include <stdlib.h> 

int 

[...] 

fclose(fp) ; 

} 

return EXIT_SUCCESS ; 

} 
$ 

Fichiers a trous 

Les systemes de fichiers utilises par Linux en general et plus particulierement le systeme ext3 
gerent les fichiers en les scindant en petits blocs dont la taille est configurable lors de la crea- 
tion du systeme de fichiers (generalement 1 Ko). Un fichier peut alors etre reparti sur le 
disque en profitant des emplacements fibres. Le noyau gere une table des blocs occupes par 
un fichier pour savoir oil trouver les donnees. 

Un cas particulier se presente pour les blocs uniquement remplis de zeros. Le noyau n'a pas 
besoin de les ecrire effectivement sur le disque puisque leur contenu est constant. Aussi, de 
tels blocs ne sont pas reellement alloues, ils sont simplement marques comme etant vierges 
dans la table associee au fichier. 

Lorsqu'un processus ecrit un fichier octet par octet sur le disque (comme cela peut etre le cas 
avec l'utilitaire cat), le noyau ne peut pas savoir a Favance qu'un bloc sera vierge, et il est 
bien oblige de lui attribuer un veritable emplacement sur le disque. 

Par contre, si on decale la position d'ecriture bien au-dela de la fin du fichier, le noyau sait que 
la zone intermediate est vierge par definition, et il economise des blocs en creant un trou dans 
le fichier. La difference entre un fichier comportant des trous et un fichier comprenant des 
blocs effectivement remplis par des zeros n'est pas perceptible lors de la lecture ni meme lors 
de la consultation de la taille du fichier avec 1 s. II faut interroger le noyau sur le volume que 
le fichier occupe effectivement sur le disque avec la commande du pour voir la difference. 

Nous allons creer un petit programme qui lit son flux d'entree standard et le copie sur la sortie 
standard, sans mettre les zeros, mais simplement en deplacant l'indicateur de position dans 
ce cas. 

exemple_fseeko_2.c : 

#define _X0PEN_SOURCE 500 
#include <stdio.h> 
#include <stdio.h> 

int 
main (void) 
{ 

int caractere; 
off_t trou; 

if (fseeko(stdout, 0, SEEK_SET) < 0) { 

fprintf (stderr, "Pas de possibility de creation de trou \n"); 
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while ((caractere = getcharO) != EOF) 

putchar(caractere) ; 
return EX IT_SUCCESS ; 

} 

trou = 0; 

while ((caractere = getcharO) != EOF) { 
if (caractere == 0) ( 
trou ++; 
continue; 

} 

if (trou != 0) { 

fseeko(stdout, trou, SEEK_CUR); 
trou = 0; 

} 

putchar(caractere) ; 

} 

if (trou ! = 0) { 

fseeko(stdout, trou - 1, SEEK_CUR); 
putchar(O) ; 

} 

return EXIT_SUCCESS; 

} 

Pour que ce programme fonctionne, il faut lui fournir en entree un fichier contenant de larges 
plages de zeros (superieures a 1 Ko). Le moyen le plus simple est d'utiliser un fichier core. 
Pour en obtenir un, nous creons un programme qui ne fait que s'envoyer a lui-meme un signal 
SIGSEGV. 

$ cat cree_core.c 

#include <signal .h> 

#include <stdlib.h> 

int 
main (void) 
{ 

raise(SIGSEGV); 
return EXIT_SUCCESS; 

} 

$ ./cree_core 

Segmentation fault (core dumped) 
$ 

Le fichier core cree contient deja des trous. Pour le verifier nous allons le copier avec cat (ce 
qui, rappelons-le, va remplacer les trous par de veritables plages de zeros) et observer les 
volumes des deux fichiers. 

$ cat < core > core. cat 
$ Is -1 core* 

_ rw i ccb ccb 57344 Nov g 01:02 core 

-rw-rw-r-- 1 ccb ccb 57344 Nov 9 01:03 core. cat 

$ du -h core* 

55k core 

57k core. cat 

$ 



484 



Programmation systeme en C sous Linux 



Finalement, nous allons utiliser notre programme de creation de trous et verifier que nous 
diminuons encore 1' occupation du fichier. 

$ ./exemple_fseeko_2 < core > core.trou 
$ Is -1 core* 

-rw 1 ccb ccb 57344 Nov 9 01:02 core 

-rw-rw-r— 1 ccb ccb 57344 Nov 9 01:03 core. cat 

-rw-rw-r— 1 ccb ccb 57344 Nov 9 01:05 core.trou 

$ du -h core* 

55k core 

57k core. cat 

42k core.trou 

$ 

Avec la taille croissante des supports de stockage actuels, l'economie de quelques blocs tient 
plutot de Fanecdote que d'un reel interet pratique, mais il est interessant de voir ainsi le 
comportement du noyau lors du deplacement en avant de la position d'ecriture. 

Problemes de portability 

Les fonctions que nous avons vues ci-dessus se comportent parfaitement bien sur un systeme 
Gnu / Linux et sur l'essentiel des systemes Unix en general. Malgre tout, certains problemes 
peuvent se poser, en particulier sur des architectures qui distinguent le stockage des donnees 
dans des fichiers binaires ou dans des fichiers de texte. Ces derniers sont parfois representes, 
sur le disque, par des tables de pointeurs vers des chaines de caracteres. Le positionnement 
dans un tel fichier est done repere a la fois par le numero de chaine et par l'emplacement du 
caractere courant dans celle-ci. 

Dans un tel cas, on ne peut plus considerer un fichier comme une succession lineaire de carac- 
teres ou d'octets, mais bien comme une entite dont la topologie peut s'etendre sur deux 
dimensions ou plus. Lutilisation du type 1 ong i nt avec f seek( ) et f tel 1 ( ) , ou du type of f_t 
avec f seeko( ) et ftel 1 o( ) , n'est plus suffisante. 

Pour assurer un maximum de portabilite a un programme, on se tournera vers les fonctions 
fgetpos( ) et fsetpos( ) : 

int fgetpos (FILE * flux, fpos_t * position); 

et 

int fsetpos (FILE * flux, fpos_t * position); 

Elles permettent de lire la position courante ou de la deplacer, en utilisant comme stockage un 
pointeur sur un objet de type fpos_t. Ce dernier est un type opaque, susceptible d'evoluer 
suivant les systemes, les versions de bibliotheque, ou meme les options de compilation. 

II n'est done pas possible de se livrer a des calculs arithmetiques sur les deplacements 
mesures par ces fonctions. La portabilite d'un programme sera assuree si on ne transmet a 
fsetpos ( ) que des pointeurs sur des valeurs ayant ete obtenues precedemment avec fgetpos ( ). 
Ces deux fonctions renvoient zero si elles reussissent, une valeur non nulle sinon, et remplis- 
sent alors la variable globale errno. 

Elles presentent malgre tout un certain nombre d'inconvenients, comme l'impossibilite de 
sauter directement a la fin du fichier, et necessitent en general de memoriser un nombre impor- 
tant de positions (le debut du fichier, de chaque section, sous-section, enregistrement. . .). 
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C'est le prix a payer pour assurer une portability optimale, principalement en ce qui concerne 
des fichiers de texte. 



Parametrage des buffers associes a un flux 

Nous avons signale rapidement qu'un flux est une association d'un descripteur de fichier et 
d'un buffer de sortie, mais finalement nous n' avons pas etudie en detail ce mecanisme. Pour- 
tant, la bibliotheque standard C offre plusieurs possibilites de parametrage des buffers, en 
fonction des operations qu'on desire effectuer sur le flux. 

Type de buffers 

II existe trois types de buffers associes a un flux : 

• Buffer de bloc : le flux dispose d'un tampon qui est rempli integralement par les donnees 
avant qu'on invoque veritablement l'appel-systeme write ( ) pour faire l'ecriture. Un gain 
de temps important est alors assure puisqu'on reduit considerablement le nombre d'appels- 
systeme a realiser. Ce type de buffer est normalement utilise pour tous les fichiers residant 
sur le disque. 

• Buffer de ligne : les donnees sont conservees dans le buffer jusqu' a ce que ce dernier soit 
plein, ou jusqu'a ce qu'on envoie un caractere de saut de ligne '\n'. Ce type de buffer est 
utilise sur les flux qui sont connectes a un terminal (generalement stderr et stdout). 

• Pas de buffer : toutes les donnees sont immediatement transmises sans delai. L'appel- 
systeme write( ) est invoque a chaque ecriture. 

II est bien evident que le buffer de ligne ne presente d'interet que si le flux est utilise pour 
transmettre du texte. Dans le cas de donnees binaires, le saut de ligne '\n' n'a pas plus de 
signification que tout autre caractere, et peut survenir a tout moment. 

II est toujours possible de forcer l'ecriture immediate du contenu du buffer en employant la 
fonction f f 1 ush( ) que nous avons vue plus haut. De meme, lorsqu'on effectue une lecture sur 
un flux (par exemple stdin), tous les buffers de lignes des flux actuellement ouverts sont 
ecrits. C'est important, par exemple pour que le message d'accueil suivant soit correctement 
affiche lors de la saisie, meme sans retour a la ligne : 

fprintf (stdout, "Veuillez entrer votre nom : "); 
fgets (chaine, LG_CHAI NE , stdin); 

Dans ce cas, le message est ecrit dans le buffer associe a stdout, puis, lorsque la lecture est 
invoquee, ce buffer est effectivement affiche, ce qui permet d' avoir un curseur place a la suite 
du message pour faire la saisie. 

Le flux stdout dispose normalement d'un buffer de ligne quand il est connecte a un terminal. 
Le flux stderr n'a pas de buffer. Les informations qu'on y ecrit arrivent immediatement sur le 
terminal. 

Voici un petit programme d' exemple destine a montrer que les donnees ecrites sur stdout sont 
affichees : 

• a la detection d'un saut de ligne, 

• sur une demande explicite f f 1 ush( ), 

• lors d'une tentative de lecture d'un flux d' entree, 
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alors que les donnees de stderr sont affichees immediatement. 
exemple_buffers.c : 

#include <stdio.h> 
#include <stdlib.h> 



int 
main (void) 
{ 

char chaine[10]; 



fprintf (stdout, "1 stdout : ligne + \\n\n"); 

fprintf (stdout, "2 stdout : ligne seule"); 

fprintf (stderr, "\n3 stderr : avant fflush(stdout)\n") ; 

fflush(stdout) ; 

fprintf (stderr, "\n4 stderr : apres fflush (stdout)\n") ; 
fprintf (stdout, "5 stdout : ligne seule "); 
fprintf (stderr, "\n6 stderr : avant fgets(stdin)\n") ; 
fgets(chaine, 10, stdin); 

fprintf (stderr, "\n7 stderr : apres fgets(stdin)\n") ; 
return EXIT_SUCCESS; 

} 

L' execution donne le resultat suivant : 

$ ./exemple_buffers 

1 stdout : ligne + \n 



3 stderr : avant fflush(stdout) 
2 stdout : ligne seule 

4 stderr : apres fflush (stdout) 



6 stderr : avant fgets(stdin) 
5 stdout : ligne seule 

[Entree] 



7 stderr : apres fgets(stdin) 
$ 

Nous voyons bien que la ligne 1 est affichee immediatement car elle se termine par un retour 
a la ligne. 

Mais la ligne 2 reste dans le buffer. La ligne 3 sur stderr apparait tout de suite. Lorsqu'on 
invoque ffl ush( ), la ligne 2 est effectivement affichee. La fonction ffl ush( ) ne revient que 
lorsque le buffer a reellement ete vide. 

Lorsque la ligne 5 est ecrite, elle reste dans le buffer. La ligne 6 est affichee immediate- 
ment puisqu'elle arrive sur stderr. En demandant une lecture sur stdin, les buffers sont 
vides et la ligne 5 est alors affichee. Nous appuyons sur la touche Entree pour terminer la 
saisie. 
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Attention 

II ne faut pas confondre la notion de buffer de ligne, qui est interne aux flux de donnees, et le mode de 
controle du terminal. Lorsqu'on doit taper sur la touche « Entree » pour valider une ligne de saisie, c'est le 
terminal qui gere cette ligne, et non le buffer de stdi n. Si on veut pouvoir lire les caracteres « au vol », sans 
attendre la touche « Entree », il faut se pencher sur les modes de controle du terminal, comme nous le ferons 
au chapitre 33. 



Modification du type et de la taille du buffer 

Lorsqu'un flux utilise un buffer, la memoire necessaire pour celui-ci est allouee lors de la 
premiere tentative d'ecriture. La taille du buffer est definie par la constante symbolique BUFSIZ, 
qu'on trouve dans <stdi o . h>. Avec la GlibC, cette constante correspond a 8 Ko. Toutefois, si 
Fallocation echoue, la bibliotheque essaye d'obtenir un buffer de 4 Ko, puis de 2 Ko, et ainsi 
de suite jusqu'a la limite de 128 octets, oil le mecanisme de la memoire tampon n'a plus 
d'interet. 

Lors de l'ouverture d'un flux, la bibliotheque prevoit un buffer de type bloc, sauf si le flux est 
connecte a un terminal, dans ce cas, le buffer est de type ligne. Le flux stderr represente une 
exception puisqu'il n'a jamais de buffer. 

Nous pouvons desirer, pour de multiples raisons, modifier le type ou la contenance du buffer 
associe a un flux. Ceci est possible avec plusieurs fonctions, qui ont grossierement le meme 
effet. 

La fonction la plus complete est setvbuf ( ) , declaree ainsi : 

int setvbuf (FILE * flux, char * buffer, int mode, size_t taille); 

Le premier argument est le flux sur lequel on veut agir. Le second est un pointeur sur un 
buffer qu'on fournit. Si ce pointeur est NULL, la fonction allouera elle-meme une zone tampon 
de la taille precisee en quatrieme argument. Nous preciserons les precautions a prendre lors 
de l'emploi d'un buffer personnalise. 

Le troisieme argument correspond au type de buffer desire. Cette valeur peut etre l'une des 
constantes symboliques suivantes : 



Nom 


Signification 


_I0FBF 


(10 Full Buffered) indique qu'on desire un buffer de bloc. 


_I0LBF 


(10 Line Buffered) pour reclamer un buffer de ligne. 


_I0NBF 


(10 No Buffered) si on ne veut aucun buffer. 



Dans ce dernier cas, les second et quatrieme arguments sont ignores. 

Lorsqu'on fournit un buffer personnalise, il doit pouvoir contenir au moins la taille indiquee 
en dernier argument. Ce buffer sera utilise par le flux de maniere opaque, il ne faut pas tenter 
d'y acceder. II est tres important de verifier que le buffer reste bien disponible tant que le flux 
est ouvert. 

La fermeture du flux ne libere que les buffers qui ont ete alloues par la bibliotheque C elle- 
meme. Ceci inclut les buffers crees par defaut et ceux qui sont alloues lors de l'invocation de 
setvbuf ( ) avec un second argument NULL. 
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II y a un risque important de bogue, difficile a retrouver, lorsqu'un flux persiste a utiliser la 
zone memoire qui lui a ete affectee alors que celle-ci a deja ete liberee. Meme la fonction 
f cl ose( ) est dangereuse si le buffer n'est plus valide. Voici un exemple de code errone : 

#define TAILLE_BUFFER 

int 
main (void) 
{ 

char buffer[TAILLE_BUFFER] ; 
FILE * fp = NULL; 

fp = fopen( . . . ) 

setvbuf(fp, buffer, _I0FBF, TAILLE_BUFFER) ; 

fwrite( . . . ) 

[...] 

return EXIT_SUCCESS; 

} 

Ce code est faux car la fermeture automatique des flux ou verts se produit apres le re tour de la 
fonction main( ), et done apres la liberation du buffer alloue automatiquement dans la pile. 
Cette zone n'etant plus valide, la fonction de liberation va acceder a une portion de memoire 
interdite et declencher un signal SIGSEGV apres le retour de mai n( ). La pile n'etant pas toujours 
geree de la meme maniere suivant les systemes d' exploitation et les compilateurs, l'erreur 
peut apparaitre de maniere totalement intempestive lors d'un portage d' application. II faut 
done etre tres prudent avec les buffers alloues explicitement. II vaut mieux, autant que 
possible, laisser la bibliotheque C gerer 1' allocation et la liberation, en lui passant un pointeur 
NULL. Si ce n'est pas possible, il est preferable d'utiliser un buffer alloue dynamiquement et de 
s' assurer que la liberation a eu lieu apres la fermeture du flux. 

La constante BUFSIZE represente une valeur qui est normalement adequate pour tout type de 
buffer. Toutefois, il vaut peut-etre mieux employer une valeur encore plus adaptee au fichier. 
Pour cela, il faut interroger le noyau en utilisant l'appel-systeme stat( ). Ce dernier, qui sera 
detaille dans le chapitre traitant des attributs des fichiers, remplit une structure de type struct 
stat, dont le membre st_bl ksize contient la taille de bloc optimale pour les entrees-sorties 
sur le systeme de fichiers utilise. II suffit done de choisir une taille de buffer egale ou multiple 
de cette valeur : 

FILE * 

ouvre_fichier (const char * nom) 
{ 

FILE * fp = NULL; 

struct stat etat; 

int taille_buffer = BUFSIZE; 

if ((fp = fopen(nom, "w+")) == NULL) 

return NULL; 
if (stattnom, & etat) == 0) 

taille_buffer = etat. st_bl ksize; 
setvbuf(fp. NULL, _I0FBF, taille_buffer); 
return fp; 

} 
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La fonction setvbuf ( ) renvoie 0 si elle reussit. Sinon, le buffer precedent n'est pas modifie. 

La fonction setbufO permet uniquement de fournir un nouveau buffer, sans modifier son 
type, ou de supprimer toute memoire tampon : 

void setbuf (FILE * flux, char * buffer); 

Si le second argument est NULL, le flux n' a plus de buffer. Sinon, il faut fournir un pointeur sur 
une zone memoire de taille BUFSIZ au minimum. 

II existe deux fonctions obsoletes setbuf fer( ) et setl i nebuf ( ), qu'on peut parfois rencontrer, 
et qui sont un heritage de BSD : 

void setbuffer (FILE * flux, char * buffer, size_t taille); 

et 

void setlinebuf (FILE * flux); 
Elles peuvent toutes les deux etre implementees ainsi : 
void 

setbuffer (FILE * flux, char * buffer, size_t taille) 
{ 

if (buffer == NULL) 

setvbuftflux, NULL, _I0NBF, 0); 

el se 

setvbuftflux, buffer, _I0FBF, taille); 

} 

void 

setlinebuf (FILE * flux) 

{ 

setvbuftflux, NULL, _I0LBF, BUFSIZ) ; 

} 

On peut s'interroger sur la necessite d'utiliser ces fonctions puisque la bibliotheque GlibC 
attribue apparemment des buffers adequats dans toutes les situations. Voici done quelques cas 
ou ces fonctions se revelent utiles : 

• Une application dont le seul role est de filtrer des lignes de texte, a la maniere de grep par 
exemple, ameliore ses performances en forcant un buffer de ligne sur stdout, meme si ce 
flux n'est pas connecte a un terminal. En effet, cette sortie peut etre redirigee par un tube 
du shell vers une autre application qui finira par faire l'affichage sur le terminal. La cohe- 
rence de l'ensemble sera mieux assuree si tous les composants du tube traitent des lignes 
de texte en une seule fois. 

• Un programme recevant des donnees en temps reel, sur une socket reseau par exemple, 
pour les traitor et les renvoyer sur sa sortie standard pourra forcer la suppression du buffer 
sur stdout, pour laisser les informations ressortir au meme rythme qu'il les a recues. 

• Un processus peut employer une socket reseau pour envoyer des messages a afficher sur 
la console d'un administrateur. Un buffer de type ligne installe sur cette socket rendra la 
communication plus efficace, en evitant notamment de laisser des lignes a moitie affichees 
en cas de ralentissement du trafic sur le reseau. 
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• Enfin, nous Favons vu, pour ameliorer les performances en ecriture sur un fichier disque, il 
est possible d'interroger le noyau pour connaitre la taille de bloc optimale et de configurer 
un buffer binaire en consequence. 

Etat d un flux 

Toute operation sur un flux est susceptible de poser des problemes, et il est important de bien 
verifier les conditions de retour de chaque lecture ou ecriture. La difficulte ici ne se situe pas 
tellement au niveau de la programmation ou de 1' implementation, mais bien plus au niveau de 
la conception du logiciel. L' attitude a adopter en cas de detection d'un probleme sur un fichier 
doit etre definie d'une maniere homogene pour toutes les entrees-sorties de 1' application. 
Le couple drastique perrorO / exitO ne peut guere etre employe que dans des petits 
programmes, du niveau des exemples que nous fournissons ici. Lutilisateur attend d'une 
application qui s'execute dans un environnement graphique une attitude un peu plus convi- 
viale qu'un simple arret abrupt a la premiere difficulte, d'autant que, la plupart du temps, la 
sortie d'erreur standard de ces applications est redirigee par le gestionnaire de fenetres vers le 
fichier .xsession-errors, et n'est done pas visible immediatement. Lattitude la plus simple 
est souvent de proposer a l'utilisateur de recommencer la sauvegarde ou la lecture apres avoir 
modifie le nom du fichier ou libere de la place sur le disque. 

Les conditions d'erreur en lecture sont indiquees par un retour NULL pour fgetsO, par 
exemple, ou par un nombre d'elements lus inferieur a celui qui est demande avec f read ( ). 

Dans ces deux cas, il n'est pas possible de distinguer immediatement une fin de fichier 
normale d'une erreur plus grave (systeme de fichiers corrompu, liaison NFS interrompue, 
support amovible extrait par erreur. . .). Pour cela, il faut appeler l'une des fonctions feof ( ) ou 
ferrorO declarees ainsi : 

int feof (FILE * flux); 
int ferror (FILE * flux); 

La premiere renvoie une valeur non nulle si la fin du fichier a ete atteinte, et la seconde adopte 
la meme attitude si une autre erreur s'est produite. Dans ce cas, la variable globale errno peut 
etre utilisee pour le diagnostic. 

II faut bien realiser que ces deux fonctions n'ont de signification qu' apres l'echec d'une 
lecture. Le code suivant est done invalide : 

void 

copie_fl ux_texte (FILE * flux_entree, FILE * flux_sortie) 
{ 

char chaine[TAILLE_MAXI] ; 

while (! feof (fl ux_entree) ) { 

fgets(chaine, TAI LLE_MAXI , f 1 ux_entree) ; 
fputs(chaine, fl ux_sortie) ; 

} 

} 

En effet, la fin de fichier n'est detectee que lorsque la lecture a echoue. Comme elle n'a pas 
modifie la chaine, qui contient la derniere ligne du fichier, celle-ci est ecrite a nouveau une 
seconde fois. De plus, ce programme ne teste justement pas les conditions d'erreur. 
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En voici une version exacte, mais guere conviviale : 
void 

copie_f 1 ux_texte (FILE * flux_entree, FILE * flux_sortie) 
{ 

char chaine[TAILLE_MAXI] ; 

while (fgets(chaine, TAI LLE_MAXI , flux_entree) != NULL) { 
if (fputstchaine, flux_sortie) == EOF) { 
perror( "f puts" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

} 

if (ferror(fl ux_entree) ) { 
perrorC'fgets") ; 
exit(EXIT_FAILURE); 




En fait, la solution la meilleure consisterait probablement a renvoyer une valeur nulle en cas 
de reussite, et -1 en cas d'echec. La routine appelante pourrait alors verifier avec ferror( ) le 
flux ayant pose un probleme, afficher un message dans une boite de dialogue, et proposer de 
recommencer apres avoir modifie les noms des fichiers. 

On peut effacer volontairement les indicateurs d'erreur et de fin de fichier associes a un flux. 
Cela se fait automatiquement lorsqu'on invoque une fonction de positionnement comme 
f seek( ), f setpos ( ) ou rewind ( ), mais aussi a l'aide de la routine clearerr( ) : 

void clearerr (FILE * flux); 

Nous avons bien indique qu'un flux est construit, par fopenO, autour d'un descripteur de 
fichier bas niveau. Celui-ci est represente par un i nt ayant une signification pour le noyau. II 
est possible d'obtenir le numero de descripteur associe a un flux en utilisant la fonction 
filenoO : 

| int fileno (FILE * flux); 

Cette fonction renvoie le numero du descripteur, ou -1 en cas d'echec (si le flux mentionne 
n'est pas valide par exemple). 

Nous verrons plus tard que la fonction f cntl ( ) nous permet de manipuler des parametres 
importants des descripteurs de fichiers, comme la lecture non bloquante ou les verrouillages, 
alors que ces operations ne sont pas possibles directement avec les flux. 

Conclusion 

Nous avons examine dans ce chapitre Fessentiel des fonctionnalites concernant la manipula- 
tion des fichiers sous forme de flux. 

La fonction fileno ( ) nous transmet done le numero du descripteur de fichier associe a un 
flux, mais dans certains cas nous desirerons travailler directement avec ces descripteurs en 
employant des primitives de bas niveau, des appels-systeme, que nous allons etudier dans le 
prochain chapitre. 
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Nous analyserons dans ce chapitre les fonctions traitant directement les descripteurs de 
fichiers, tant du point de vue de la lecture ou ecriture que pour les mecanismes plus 
complexes de controle des acces (verrouillage, lecture non bloquante...). 

Nous nous retrouvons done a un niveau plus bas que dans le chapitre precedent ; ici nous 
serons plus proches du noyau. 

Ouverture et fermeture d'un descripteur de fichier 

Un descripteur est un entier compris entre 0 et la valeur de la constante 0PEN_MAX qui est 
definie dans <1 itnits.h> (1024 sous Linux). Les descripteurs 0, 1 et 2 sont reserves respecti- 
vement pour l'entree et la sortie standard, ainsi que pour la sortie d'erreur. Ces valeurs sont 
employees directement dans un si grand nombre d' applications qu'elles sont probablement 
immuables, mais on peut toutefois les remplacer a profit par les constantes symboliques 
STDIN FILENO, STD0UT_FI LENO et STDERR_FILENO, qui sont definies dans <unistd.h>. 

II est possible d'obtenir des descripteurs a partir d'autres elements que des fichiers. Les 
appels-systeme pipe( ) ou socket( ) permettent d' avoir les descripteurs d'un tube de commu- 
nication ou d'une liaison reseau. Nous reviendrons sur ces types de descripteurs dans les 
chapitres consacres a la communication entre processus et a la programmation reseau. 

Pour l'instant, nous allons nous interesser au moyen d'obtenir un descripteur sur un fichier. II 
existe pour cela deux appels-systeme, open( ) et create ), le premier est un prototype avec un 
argument optionnel : 

int open (const char * nom_fichier, int attributs, ...I* mode_t mode */); 
int creat (const char * nom_fichier, mode_t mode); 

La fonction open ( ) prend en premier argument le nom d'un fichier a ouvrir. Le principe est le 
meme qu'avec fopen( ) ; si cette chame commence par un 7' elle est considered comme un 
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chemin debutant a la racine du systeme de fichiers, sinon elle est prise en compte a partir du 
repertoire actuel. 

Le second argument est une combinaison de plusieurs elements assembles par un OU binaire. 
Tout d'abord, il faut imperativement utiliser l'une des trois constantes suivantes : 

• 0_RD0NLY : fichier ouvert en lecture seule ; 

• 0_WR0NLY : fichier ouvert en ecriture seule ; 

• 0_RDWR : fichier ouvert a la fois en lecture et en ecriture. 



Attention 

II est important de bien realiser qu'il s'agit de trois constantes independantes et que le mode lecture-ecriture 
n'est pas une association du mode lecture seule et du mode ecriture seule. La constante symbolique 0_RDWR 
n'est pas un OU binaire entre les deux autres. 



Ensuite on peut utiliser les constantes suivantes, qui permettent de preciser le mode d'ouver- 
ture : 

• 0_CREAT : pour creer le fichier s'il n'existe pas. Ceci fonctionne meme avec l'ouverture 
CLRDONLY, bien que le fichier ainsi concu reste desesperement vide. Si Fargument 0_CREAT 
n'est pas mentionne, l'appel-systeme echoue quand le fichier n'existe pas. 

• 0_EXCL : cette constante doit etre employee conjointement a 0_CREAT. L'ouverture echouera 
si le fichier existe deja. Ceci nous permet de garantir que nous venons de creer le fichier. 
L'appel-systeme etant atomique, nous sommes egalement assure de ne pas entrer en conflit 
avec un processus concurrent tentant la meme operation. 

• 0_TRUNC : si le fichier existe deja, sa taille sera ramenee a zero. Cette option ne doit norma- 
lement etre utilisee qu'en ouverture 0_RDWR ou 0_WR0NLY. 

Enfin, les constantes suivantes sont utilisees pour parametrer le mode de fonctionnement du 
fichier lors des lectures ou ecritures : 

• 0_APPEND : il s'agit d'un mode d'ajout. Toutes les ecritures auront lieu automatiquement en 
fin de fichier. Ce mode d'ecriture peut aussi etre modifie apres l'ouverture du fichier, en 
utilisant l'appel-systeme fcntl (). II ne faut pas confondre le mode d'ecriture en fin de 
fichier et le mode d' ouverture lui-meme. 0_A P P E N D peut tres bien etre associe a 0_TRUNC par 
exemple, meme si cela parait etonnant au premier abord. C'est le moyen de creer des 
fichiers de journalisation (comme /var/1 og/messages), qu'on reinitialise a chaque demar- 
rage du programme. L'avantage de ce mode d'ecriture est que le deplacement en fin de 
fichier est lie de maniere atomique a l'ecriture, ce qui est indispensable quand plusieurs 
processus doivent ecrire dans le meme fichier (justement dans le cas d' une journalisation). 
Nous reviendrons sur ce concept a la prochaine section. 

• 0_N0CTTY : si le descripteur ouvert est un terminal, il ne faut pas le prendre comme terminal 
de controle du processus, meme si ce dernier n'en a pas a ce moment-la. 

• 0_N0NBL0CK : cet attribut indique que les acces aux descripteurs seront non bloquants. En 
fait, cette option n'est jamais interessante avec les fichiers disque, aussi son emploi avec 
open( ) est-il tres rare. On le reserve aux files ou a certains fichiers speciaux correspondant 
a des peripheriques. Traditionnellement, on se sert plutot de l'appel-systeme fcntl ( ) pour 
configurer l'option de non blocage apres l'ouverture des descripteurs ou il peut servir 
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for (i = 1; i < argc; i ++) 

if (sscanf(argv[i], "Sid", & pid) != 1) { 

fprintf (stderr, "PID invalide : Ss\n", argv[i]); 
} else { 

sid = (long) getsi d( (pi d_t ) pi d ) ; 
if (sid == -1) 

fprintf (stderr, "Sid inexistant\n" , pid); 

el se 

fprintf(stderr, "Sid : %ld\n", pid, sid); 

} 

return 0; 

} 



ps ax 








509 ? 


SW 


0 


00 [kdm] 


521 ? 


s 


1 


01 kwm 


538 ? 


s 


0 


03 kbgndwm 


554 ? 


s 


2 


36 /usr/bin/kswarm.kss -delay 3 -install -corners iiii - 


566 ? 


s 


0 


43 kfm 


567 ? 


s 


0 


01 krootwm 


568 ? 


s 


0 


40 kpanel 


587 ? 


SN 


0 


02 /usr/bin/kapm 


747 ? 


SW 


0 


00 [axnet] 


748 ? 


s 


15 


09 /usr/local/applix/axdata/axmain -helper 


750 ? 


SW 


0 


00 [applix] 


758 ? 


s 


0 


05 konsole -icon konsole.xpm -mim'icon konsole.xpmi -cap 


759 ? 


s 


0 


01 /bin/bash 


763 ? 


SW 


0 


00 [gnome-name-serv] 



$ ./exemple_getsid 0 567 748 521 



0 : 


759 


567 


: 501 


748 


: 501 


521 


: 501 



$ 

Nous voyons que le processus en cours appartient a la session de son interpreteur de 
commandes (/bi n/bash) et que les applications graphiques dependent du serveur XI 1. 

L'interaction entre un processus et un terminal s'effectue done par 1' intermediate de plusieurs 
indirections : 

• Le processus appartient toujours a un groupe. 

• Le groupe appartient dans son integralite a une session. 

• La session peut - eventuellement - avoir un terminal de controle. 

• Le terminal connait le numero du groupe de processus en avant-plan. 

C'est en general le leader de session (le shell) qui assure le basculement en avant-plan ou en 
arriere-plan des groupes de processus de sa session, en utilisant les fonctions de dialogue avec 
le terminal, tcgetpgrp( ) et tcsetpgrp( ). Ces fonctions seront analysees ulterieurement dans 
le chapitre 33. 
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(sockets, tubes. ..)• Les seuls cas oil 0_N0NBL0CK est indispensable avec open( ) sont l'ouver- 
ture d'un fichier special correspondant a un port serie et Fouverture des deux extremites 
d'un tube nomme dans le meme processus. Nous decrirons ces deux situations dans les 
chapitres 30 et 33. 

• 0_SYNC : les ecritures sur le descripteur auront lieu de maniere synchronisee. Cela signifie 
que le noyau garantit que l'appel-systeme write( ) ne reviendra pas avant que les donnees 
aient ete transmises au peripherique. Rappelons que, dans le cas de disques SCSI par 
exemple, les controleurs peuvent encore garder les donnees en memoire tampon pendant 
une duree certaine avant leur ecriture physique. Nous reparlerons de cette option en 
etudiant l'appel write( ). 

En fait, on utilise couramment 0_CREAT et 0_TRUNC, plus rarement 0_APPEND et 0_EXCL 

Pour travailler sur les ports serie, on emploie souvent 0_N0NBL0CK (ou CLNDELAY qui est un alias 
obsolete), mais les autres constantes sont nettement moins sollicitees. 

Le troisieme argument de l'appel open( ) ne sert que lors d'une creation de fichier. II faut done 
que Fattribut 0_CREAT ait ete indique. Cette valeur, de type mode_t, sert a signaler les autorisa- 
tions d'acces au fichier nouvellement cree. On peut la fournir directement en mentionnant la 
valeur numerique. Celle-ci n'est lisible que dans une representation octale, et doit done etre 
prefixee par un '0' en langage C pour etre comprise comme telle par le compilateur. II est 
toutefois preferable de cumuler, par 1' intermediate d'un OU binaire, les constantes suivantes : 



Constante 


Valeur octale 


Signification 


S_ 


.ISUID 


04000 


Activation du bit Set-UID. Le programme s'executera avec I'UID effectif de son 
proprietaire. 


s_ 


.ISGID 


02000 


Activation du bit Set-GID. Le programme s'executera avec le GID effectif de son 
groupe. 


s_ 


.ISVTX 


01000 


Activation du bit « Sticky ». N'a apparemment plus d'utilite pour les fichiers reguliers 
de nos jours. 


s_ 


.IRUSR 


00400 


Autorisation de lecture pour le proprietaire du fichier. 


s_ 


.IWUSR 


00200 


Autorisation d'ecriture pour le proprietaire du fichier. 


s_ 


.IXUSR 


00100 


Autorisation d'execution pour le proprietaire du fichier. 


s_ 


.IRWXU 


00700 


Lecture + Ecriture + Execution pour le proprietaire du fichier. 


s_ 


.IRGRP 


00040 


Autorisation de lecture pour le groupe du fichier. 


s_ 


.IWGRP 


00020 


Autorisation d'ecriture pour le groupe du fichier. 


s_ 


.IXGRP 


00010 


Autorisation d'execution pour le groupe du fichier. 


s_ 


.IRWXG 


00070 


Lecture + Ecriture + Execution pour le groupe du fichier. 


s_ 


.IROTH 


00004 


Autorisation de lecture pour les autres utilisateurs. 


s_ 


.IWOTH 


00002 


Autorisation d'ecriture pour les autres utilisateurs. 


s_ 


.IXOTH 


00001 


Autorisation d'execution pour les autres utilisateurs. 


s_ 


.IRWXO 


00007 


Lecture + Ecriture + Execution pour les autres utilisateurs. 



L' ensemble d'autorisations qu'on utilise le plus frequemment est « S_I RUSR | S_IWUSR | 
S_I RGRP | S_IR0TH » (0644), qui permet de donner les droits de lecture a tous et les droits 
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d' ecriture seulement au proprietaire. Un programme peut parfois creer un fichier executable 
(disons un shell script, pas obligatoirement un executable binaire !). Dans ce cas, il utilisera 
probablement les permissions « S_IRWXU | S_I RGRP | S_IXGRP | S_IR0TH | S_IX0TH » (0755). 



Figure 19.1 
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t rwx rwx rwx 

J J 



lecture 

ecriture - 
execution 



II faut etre tres prudent avec les autorisations qu'on accorde au groupe du fichier. En effet, les 
systemes Unix peuvent adopter deux attitudes differentes lors de la creation d'un fichier : 

• Certains donnent au nouveau fichier le groupe effectif du processus qui le cree. 

• D' autres utilisent le groupe du repertoire dans lequel le fichier est place. Ceci permet 
d'assurer la coherence de larges arborescences. 

Ces deux mecanismes etant autorises par SUSv3, il est important de verifier, apres la creation 
d'un fichier, que son groupe est bien celui qui est attendu, si on a employe S_IWGRP par exemple. 

Linux adopte 1' attitude a priori la plus sage, qui consiste a utiliser le groupe effectif du 
processus createur, a moins que le bit Set-GID ne soit positionne sur le repertoire d'accueil. 
Dans ce cas, c'est le groupe de ce dernier qui est choisi. 

Le mode ainsi transmis est toutefois filtre a travers le umask du processus. Cette valeur, a 
laquelle nous verrons comment acceder dans un prochain chapitre, est retiree du mode 
indique. Ainsi, si le umask du processus vaut 0002, un mode 0666 sera automatiquement 
converti en 0664. 

II est important de fournir un argument mode lorsqu'on utilise Foption 0_CREAT de open( ), 
sinon les autorisations d'acces sont totalement imprevisibles (et generalement desastreuses). 

L'appel-systeme creat( ), de moins en moins utilise, est en fait equivalent a : 

open (nom_fichier, 0_CREAT | 0_WR0NLY | 0_TRUNC , mode); 
Lorsqu'on a fini d'utiliser un descripteur, on le referme a l'aide de l'appel-systeme cl ose( ) : 

int close (int fd) ; 

Comme nous l'avions remarque avec f cl ose( ), la valeur de retour de cl ose( ) est la derniere 
chance de detecter une erreur qui s'est produite durant une ecriture differee dans le fichier. Si 
cl ose( ) ne renvoie pas 0, le contenu du fichier est probablement inexact, et il est important de 
prevenir l'utilisateur, afin de recommencer la sauvegarde des donnees par exemple. 
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ii B 

Un aspect deroutant des entrees-sorties de bas niveau, par rapport a la bibliotheque <stdi o . h>, 
est que les prototypes et les constantes utilises sont repartis dans une multitude de fichiers 
d'en-tete qui sont evidemment susceptibles de changer suivant les versions d'Unix. Pour les 
fonctions que nous avons etudiees, il faut inclure les fichiers suivants : 



Fichier 


Utilite 


<fcntl .h> 


Contient les prototypes de opent ) etde creat( ), ainsi que les constantes 0_xxx. 


<sys/stat.h> 


Contient les constantes de mode S_Ixxx. 


<sys/types . h> 


Pas obligatoire sous Linux, ce fichier peut etre necessaire sous d'autres versions d'Unix pour 
obtenir la definition de mode_t. 


<uni std . h> 


Contient la declaration de closet ). Cette fonction n'est en effet pas limitee aux fichiers, mais 
serf pour tous les descripteurs Unix. 



II est done conseille d' inclure systematiquement ces quatre fichiers en debut de programme 
pour pouvoir utiliser les descripteurs avec le maximum de portabilite. 

L'exemple suivant presente plusieurs tentatives d'ouverture de fichiers. Nous affichons a 
chaque fois les arguments employes et le resultat. 

exemple_open.c : 

#include <fcntl .h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <sys/stat.h> 

#include <sys/types.h> 

void 

ouverture_fichier (char * nom, char * type, int attribut, mode_t mode) 
{ 

int fd; 

fprintf (stderr, "%s(%s) : ", nom, type); 
fd = opentnom, attribut, mode); 
if (fd < 0) { 

perrorC'"); 
} else { 

fprintf (stderr, "0k\n"); 

cl ose(fd) ; 

} 

} 

int 
main (void) 

{ 

ouverture_fichier("/etc/inittab" , "0_RD0NLY" , 0_RD0NLY, 0); 
ouverture_fichier("/etc/inittab" , "0_RDWR", 0_RDWR, 0); 
ouverture_fichier("essai .open", "0_RD0NLY" , 0_RD0NLY, 0); 
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ouverture_fichier("essai .open", "0_RDWR", 0_RDWR, 0); 
ouverture_fichier("essai .open", "0_RD0NLY | 0_CREAT, 0640", 

0_RD0NLY | 0_CREAT, 

S_I RUSR | S_IWUSR | S_IRGRP); 
ouverture_fichier("essai .open", "0_RDWR | 0_CREAT | 0_EXCL, 0640", 

0_RDWR | 0_CREAT | 0_EXCL, 

S_I RUSR | S_IWUSR | S_IRGRP); 

return EXIT_SUCCESS ; 

} 

Lors de l'execution, les tentatives d'ouverture d'un fichier systeme dans /etc/ ne fonction- 
nent evidemment qu'en lecture seule. En ce qui concerne le fichier essai .open, il n'est pas 
possible de Fouvrir s'il n'existe pas, tant qu'on ne precise pas l'option CLCREAT. Par contre, 
dans ce cas, l'ouverture echoue si le fichier existe et qu'on a demande l'exclusivite avec 
0_EXCL. 

$ ./exemple_open 

/etc/inittab(0_RD0NLY) : 0k 

/etc/inittab(0_RDWR) : Permission non accordee 

essai .open(0_RD0NLY) : Aucun fichier ou repertoire de ce type 

essai .open(0_RDWR) : Aucun fichier ou repertoire de ce type 

essai .open(0_RD0NLY | 0_CREAT, 0640) : 0k 

essai .open(0_RDWR | 0_CREAT | 0_EXCL, 0640) : Le fichier existe. 
$ 1 s -1 essai .open 

-rw-r 1 ccb ccb 0 Nov 12 16:19 essai. open 

$ rm essai .open 
$ 

Nous verifions que les droits accordes sont bien ceux qu'on a demandes. En revanche, 
l'exemple tres simple qui suit montre l'influence de l'attribut umask du processus creant le 
fichier. 

exemple_open 2.c : 

#incl ude <fcntl .h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <sys/stat.h> 

#include <sys/types.h> 

int 
main (void) 
f 

int fd; 

if ((fd = open( "essai. open", 0_RDWR | 0_CREAT | 0_EXCL, 0777)) < 0) 
perror( "open" ) ; 

el se 

close(fd); 
return EXIT_SUCCESS; 

} 
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Nous demandons la creation d'un fichier avec toutes les autorisations possibles. 

$ ./exemple_open_2 
$ Is -1 essai.open 

-rwxrwxr-x 1 ccb ccb 0 Nov 12 16:26 essai.open 

$ umask 

002 

$ rm essai .open 

$ 

Lors de 1' execution du programme, le contenu de notre attribut umask est extrait des autorisa- 
tions demandees, ce qui supprime le droit d'ecriture pour tout le monde. 

Nous avons indique, dans le paragraphe concernant l'ouverture d'un flux, que la bibliotheque 
GlibC ajoutait une extension Gnu a la fonction fopenO, en permettant de demander une 
ouverture exclusivement si le fichier n'existe pas. Ce mecanisme peut etre indispensable pour 
s' assurer que deux processus concurrents ne risquent pas d'ecrire simultanement dans le 
meme fichier. Cette option n'etant generalement pas disponible sur d'autres environnements 
que la GlibC, on peut etre tente de l'implementer naivement ainsi : 

FILE * 

fopen_excl usi f (const char * nom_fichier, const char * mode) 
{ 

FILE * fp; 

if ((fp = fopen(nom_fichier, "r")) != NULL) { 

fcl ose(fp) ; 

errno = EEXIST; 

fp = NULL; 
} else { 

fp = fopen(nom_fichier, mode); 

} 

return fp; 

} 

Cette routine ne fonctionne pas car le processus peut fort bien etre interrompu entre la 
premiere tentative d' ouverture, qui sert a verifier 1' existence, et l'ouverture effective du 
fichier. Le noyau peut alors commuter vers une autre tache concurrente qui cree egalement le 
meme fichier. Les deux processus auront l'impression d'acceder exclusivement au fichier 
alors que ce ne sera pas le cas. 

Pour eviter ce probleme, il faut s' arranger pour que la verification d' existence et l'ouverture 
meme soient atomiquement liees. Ceci est garanti par l'appel-systeme open( ) avec l'attribut 
0_EXCL. On peut alors utiliser fdopen( ) pour obtenir un flux construit autour du descripteur 
ainsi ouvert. Le programme suivant implemente correctement un fopen( ) exclusif. 

exemple_open 3.c : 

#include <errno.h> 

#include <fcntl .h> 

#include <stdio.h> 

finclude <stdlib.h> 

#include <unistd.h> 

#include <sys/types.h> 

#include <sys/stat.h> 
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FILE * 

fopen_exclusif (const char * nom_fichier, const char * mode_flux) 
{ 



int 


lecture 


= 0 


int 


ecriture 


= 0 


int 


ajout 


= 0 


int 


creation 


= 0 


int 


troncature 


= 0 


int 


f 1 ags 


= 0 


int 


i ; 




int 


fd; 




FILE 


* fp; 





for (i = 0; i < strl en(mode_f 1 ux) ; i ++) { 
switch (mode_f 1 ux[i ] ) { 
case 'a' : 

ecriture = lecture = ajout = 1; 

break; 
case 'r' : 

lecture = 1; 

break; 
case 'w' : 

ecriture = creation = troncature = 1; 

break; 
case '+' : 

ecriture = lecture = 1; 

break; 
default : 

/* soyons tolerants... on ne dit rien */ 
break; 

} 

} 

if (lecture & ecriture) 

flags = 0_RDWR; 
else if (lecture) 

flags = CLRDONLY; 
else if (ecriture) 

flags = CLWRONLY; 
el se { 

errno = EINVAL; 

return NULL; 

} 

if (creation) 

flags |= 0_CREAT; 
if (troncature) 

flags |= 0_TRUNC; 
flags |= 0_EXCL; 

fd = open(nom_fichier, flags, 0644); 
if (fd < 0) 

return NULL; 
fp = fdopen(fd, mode_flux); 
cl ose(fd) ; 
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return fp; 

} 

void 

ouverture (const char * nom, const char * mode, int exclusif) 
{ 

FILE * fp; 

fprintf (stderr, "Ouverture %s de Is, mode %s : ", 
(exclusif ? "exclusive" : ""), nom, mode); 
if (exclusif) 

fp = fopen_exclusif(nom, mode); 

else 

fp = fopen(nom, mode); 
if (fp == NULL) 

perrorC'"); 
el se { 

fprintf (stderr, "Ok\n"); 
fcl ose(fp) ; 

} 

} 

int 
main (void) 

{ 

ouverturet "essai .open_3" , "w+", 1); 
ouverturet "essai .open_3" , "w+", 1); 
ouverturet "essai .open_3" , "w+", 0); 
return EXIT_SUCCESS; 

} 

Verifions que les ouvertures reussissent quand le fichier n'existe pas, et qu'elles echouent 
sinon : 

$ ./exemple_open_3 

Ouverture exclusive de essai .open_3, mode w+ : Ok 

Ouverture exclusive de essai .open_3, mode w+ : Le fichier existe. 

Ouverture de essai .open_3, mode w+ ; Ok 

$ rm essai .open_3 

$ 

Nous avons vu les principales methodes permettant d'obtenir un descripteur de fichier. Nous 
examinerons ulterieurement la notion de duplication d'un descripteur, mais pour le moment 
nous allons nous interesser aux primitives permettant d'en lire le contenu ou d'y ecrire des 
donnees. 



Lecture ou ecriture sur un descripteur de fichier 

Contrairement au foisonnement de fonctions qui sont mises a notre disposition par la biblio- 
theque C pour lire ou ecrire sur un flux de donnees, le nombre d'appels-systeme manipulant 
les descripteurs est particulierement concis. II existe en tout six appels-systeme pour lire ou 
ecrire des donnees, dont quatre sont rarement employes et sont en fait des derives des deux 
principaux. Toutefois, a cause de notre proximite avec le noyau lors de Futilisation de ces 
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primitives de bas niveau, il est important de bien comprendre F ensemble des phenomenes 
entrant en jeu. 

Primitives de lecture 

La routine de lecture la plus courante s'appelle... readO ! Son prototype est declare ainsi 
dans <unistd.h> : 

ssize_t read (int descripteur, void * bloc, size_t taille); 

Cette fonction lit dans le descripteur le nombre d' octets reclames en troisieme argument et les 
place dans le buffer fourni en deuxieme argument. Si le descripteur permet le positionnement 
(par exemple un fichier disque), la lecture a lieu a 1' emplacement indique par son indicateur 
de position, que nous etudierons dans une prochaine section. Ensuite, cet indicateur est 
augmente du nombre d'octets lus. Si, au contraire, le descripteur ne permet pas le positionne- 
ment (port de communication serie par exemple), la lecture a lieu a la position courante du 
descripteur. Dans ce cas, Findicateur de positionnement n'est pas mis a jour. 

L'appel-systeme renvoie le nombre d'octets lus. Si cette valeur correspond a la taille 
demandee, tout s'est bien passe. Si cette valeur est inferieure a la taille attendue mais qu'elle 
est positive, l'appel-systeme n'a pu lire qu'une partie des donnees voulues : 

• Pour un descripteur correspondant a un fichier ordinaire, on a probablement atteint la fin 
du fichier. 

• Pour un tube de communication, le correspondant a ferme son extremite du tube. 

• Pour une socket, le protocole reseau utilise certainement des paquets de donnees de taille 
inferieure a celle qui est reclamee. 

Dans ce dernier cas, la situation est normale et se repetera probablement a chaque lecture. Par 
contre, dans le cas d'un tube ou d'un fichier, il est presque certain que nous sommes arrive a 
la fin des donnees lisibles (fin du fichier ou fermeture du tube). Pour s'en assurer, la lecture 
suivante devrait renvoyer 0. 

Si on indique une taille nulle en troisieme argument, read( ) n'a aucun effet et renvoie 0. 

En cas de veritable erreur, read( ) renvoie -1. Le type ssize_t de sa valeur de retour corres- 
pond a un s i ze_t signe. La valeur maximale que peut contenir ce type de donnee est indiquee 
par la constante symbolique SSIZE_MAX definie dans <limits.h>. Avec la GlibC sur un proces- 
seur x86, elle vaut 32 767. On se limitera done a cette dimension pour les blocs reclames, meme 
si la taille maximale du troisieme argument de read( ) permet d'utiliser le double de valeur. 

II faut done prendre trois cas en consideration dans la valeur de retour de read( ) : 

• Valeur de retour strictement positive : la lecture s'est bien passee, mais nous ne disposons 
que du nombre d'octets indique par la valeur de retour de la fonction. Si ce nombre est 
inferieur a la taille reclamee, ce n'est une erreur que si le contexte de 1' application exige 
une lecture correspondant exactement a la dimension voulue. 

• Valeur de retour nulle : fin de fichier ou de communication, mais pas d' erreur rencontree 
jusque-la. 

• Valeur de retour inferieure a zero : une erreur s'est produite, il faut analyser la variable 
globale errno. Si cette derniere contient la valeur EINTR, il y a simplement eu un signal qui 
a interrompu l'appel-systeme read( ) avant qu'il ait eu le temps de lire quoi que ce soit. 
Dans ce cas on peut recommencer sereinement la lecture. 
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Dans le cas d'un descripteur correspondant a un tube, a une socket, ou a un fichier special de 
peripherique pour lequel on a demande des lectures non bloquantes, read( ) peut egalement 
renvoyer-1, et placer EAGAIN dans la variable errno simplement si aucune donnee n'est dispo- 
nible. 

Dans un programme travaillant avec des liaisons reseau ou des tubes de communication - cas 
oil readO est un appel-systeme lent- il est ainsi frequent d'en encadrer toutes les invoca- 
tions ainsi : 

while ( (nb_octets_l us = readtfd, buffer, tai 1 1 e_voul ue) ) == -1) 
if (errno != EINTR) 
break; 

Cette boucle permet de recommencer la lecture tant que 1' appel-systeme est interrompu par 
un signal. Le probleme des lectures non bloquantes est plus complexe, car on ne peut se 
contenter de faire une boucle whileO, comme dans le cas de EINTR, au risque de voir notre 
programme boucler en consommant inutilement des cycles du processeur. Pour eviter cela, il 
existe plusieurs methodes fondees sur les appels-systeme selectO et pollO, que nous 
verrons dans le chapitre 30. 

Notons que si la lecture est bloquante et si un signal interrompt read( ) alors qu'il a deja lu 
quelques octets, il renverra le nombre lu, sans signaler d'erreur. Les applications faisant un 
large usage de signaux et de tubes de communication (ou de sockets reseau) sont souvent 
obligees d'implementer un mecanisme de memoire tampon autour de 1' appel-systeme read( ) 
lorsqu'il faut lire des enregistrements constitues d'un nombre precis d'octets. 

Un processus qui tente de lire depuis son terminal de controle alors qu'il se trouve en arriere- 
plan recoit un signal SIGTTIN. Ce signal, par defaut, arrete le processus mais sans le tuer. 
Si toutefois SIGTTIN est ignore, 1' appel-systeme readO echoue avec l'erreur EIO. On peut 
imaginer un programme demandant un certain nombre de confirmations a l'utilisateur en 
fonctionnement interactif, mais desirant ignorer volontairement SIGTTIN, lorsqu'il est lance 
en arriere-plan, pour continuer a s'executer comme si de rien n'etait. II devra alors utiliser des 
valeurs par defaut pour les saisies attendues quand read( ) declenche l'erreur EIO. 

La seconde fonction de lecture que nous allons etudier est readv( ), qui permet de regrouper 
plusieurs lectures dans un seul appel. L'interet de cette routine est de repartir sur plusieurs 
zones de donnees le cout d'un appel-systeme. Cette fonction est declaree ainsi dans <sys/ 
uio.h> : 

ssize_t readv (int descripteur, 

const struct iovec * vecteurs, 
int nombre) ; 

Cette fonction lit sequentiellement les donnees provenant du descripteur indique en premier 
argument, et remplit les zones memoire correspondant au nombre de vecteurs mentionne en 
dernier argument. Un tableau de vecteurs est transmis en second argument. Les vecteurs de 
type struct iovec contiennent les membres suivants : 



Type Nom Utilisation 



void * 


iov_base 


Un pointeur sur la zone memoire de ce vecteur 


size t 

1 


iov_len 


La longueur de cette zone memoire 
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La valeur renvoyee est le nombre total d'octets lus (et pas le nombre de vecteurs remplis). 
Suivant les systemes, le type de la valeur de retour de cet appel-systeme peut etre int ou 
ssizejt, aussi ne faut-il pas s'etonner d'avoir un avertissement - sans consequence - du 
compilateur. Les conditions d'erreur sont les memes que pour read( ). On peut l'utiliser par 
exemple pour grouper la lecture binaire de plusieurs variables : 

int numero; 
double x, y, z; 

struct iovec vecteur[4]; 



vecteur[0] 


iov_ 


_base = 


& numero; 


vecteur[0] 


iov_ 


Jen = 


sizeof (int) ; 


vecteur[l] 


iov_ 


_base = 


& x; 


vecteur[l] 


iov_ 


Jen = 


sizeof (double) 


vecteur[2] 


iov_ 


Jjase = 


& y; 


vecteur[2] 


iov_ 


Jen = 


sizeof (double) 


vecteur[3] 


iov_ 


Jjase = 


& z; 


vecteur[3] 


iov_ 


Jen = 


sizeof (double) 



nb_lus = readv(fd, vecteur, 4); 
if (nb_lus != sizeof(int) + 3 * sizeof(double)) 
return -1; 

On pourrait effectuer le meme travail avec une structure regroupant les diverses variables, 
mais le compilateur insere, pour aligner les champs, des octets supplementaires susceptibles 
de nous compliquer la lecture. Malgre tout, cet exemple n'est certainement pas le meilleur car 
les lectures groupees avec readvO deviennent surtout performantes lorsqu'il y a un nombre 
important de vecteurs de petites tailles. 

II existe une autre fonction de lecture nommee pread( ), assez peu utilisee. Elle a ete imple- 
mentee sous Linux sous forme d' appel-systeme a partir du noyau 2.2. Elle est declaree dans 
<unistd. h> : 

ssize_t pread (int descripteur, void * bloc, 
size_t taille, off_t position); 

Pour qu'elle soit effectivement declaree dans <unistd.h>, il faut definir la constante symbo- 
lique _X0PEN_S0URCE et lui donner la valeur 500, avant d'inclure le fichier d'en-tete. Cette 
fonction sert a implementer les mecanismes d' entree-sortie asynchrones que nous verrons 
dans le chapitre 30. 

Le comportement de cette routine ainsi que sa valeur de retour sont identiques a ceux de 
readO, sauf que les donnees ne sont pas lues directement a la position courante dans le 
descripteur mais a celle qui est indiquee en quatrieme argument. Cette position est mesuree 
en octets depuis le debut du fichier. De plus, pread ( ) ne modifie pas la position courante du 
descripteur, celle-ci restant inchangee au retour de 1' appel-systeme. Bien entendu cette fonc- 
tion echoue si le descripteur ne permet pas le positionnement (par exemple un tube). II est 
important de remarquer que cette fonction, malgre son nom, n'a aucun rapport avec popen( ) 
et pel ose( ) que nous avons analysees dans le chapitre 4. 
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Primitives d'ecriture 

Les trois appels-systeme d'ecriture que nous allons examiner representent le contrepoint des 
primitives de lecture. Nous trouvons write( ), writev( ) et pwrite( ), dont les prototypes sont : 

ssize_t write (int descripteur, const void * bloc, size_t taille); 
ssize_t writev (int descripteur, const struct iovec * vecteur, 
int nombre) ; 

ssize_t pwrite (int descripteur, const void * bloc, 
size_t taille, off_t position); 

La fonction write ( ) ecrit le contenu du bloc indique en deuxieme argument dans le descripteur 
fourni en premier argument. Elle renvoie le nombre d'octets effectivement ecrits ou -1 en cas 
d'erreur. Si la taille du bloc indiquee est nulle, wri te ( ) transmet simplement 0, sans autre effet. 

Lorsque le descripteur autorise le positionnement, et s'il n'a pas l'attribut 0_APPEND, l'ecriture 
prend place a la position courante de celui-ci. Sinon, l'ecriture a lieu a la fin du fichier. 

Pour bien analyser les problemes de deplacement au sein du fichier et de concurrence des 
processus, nous devons observer le mecanisme interne des entrees-sorties. Ces concepts 
datent des premieres versions d'Unix et sont restes a peu pres constants au cours des evolu- 
tions de ce systeme. 

Un processus dispose d'une table personnelle des descripteurs ouverts. Cette table est 
contenue, sous Linux, dans une structure files_struct, definie dans le fichier d'en-tete du 
noyau <linux/sched.h>. Cette table comprend pour chaque descripteur divers attributs 
(comme celui de fermeture sur execution, que nous verrons plus loin) et un pointeur sur une 
structure f i 1 e, definie dans <1 i nux/f s . h>. 

La structure file comporte, entre autres, le mode d' utilisation du descripteur (lecture, ecri- 
ture, ajout. . .) ainsi que la position courante. Elle dispose indirectement d'un pointeur sur une 
structure inode definie dans le meme fichier. Entre elles s'intercale en realite une indirection 
supplementaire due a une structure dirent, determinee dans <1 inux/dcache.h>, qui sert a 
gerer une zone de memoire cache, qui est hors de notre propos actuel. La structure inode 
rassemble toutes les informations necessaires a la localisation reelle du fichier sur le disque 
ou a l'acces aux donnees si le descripteur correspond a une socket ou a un tube. 

La structure f i 1 e contient des pointeurs sur des fonctions qui, a la maniere des methodes de 
classe C++, implementent les primitives d' entree-sortie (open, read, write, lseek, mmap...) 
correspondant au type de fichier employe. 

Un descripteur est done entierement decrit par trois niveaux de details, qui font partie de 
F implementation traditionnelle d'Unix. Le processus comporte une table des descripteurs 
attribuant des numeros a chaque descripteur ouvert. Ceux-ci ont une correspondance dans la 
table des fichiers contenant notamment le mode d'acces et la position. Les fichiers possedent 
a leur tour un correspondant dans la table des i-nceuds (inode ou index node) du systeme. 

Nous devrons revenir sur ce mecanisme lorsque nous etudierons les possibilites de partage de 
fichier. Pour F instant, nous retiendrons que la position dans un descripteur appartient a la 
structure file, alors que la longueur du fichier est contenue dans la structure i node. 

Lorsqu'on ecrit des donnees dans un descripteur, le noyau emploie le pointeur de fonction 
write( ) de la structure file associee pour transmettre les informations. Ensuite, il augmente 
la position courante de cette structure du nombre d'octets ecrits. Si cette position depasse la 
taille du fichier memorisee dans l'i-nceud, celle-ci est mise a jour. 
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Figure 19.2 
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type ... 



"./essai.txt" 



taille 600 



struct inode 



Lorsque le mode d' ecriture du descripteur correspond a un ajout en fin de fichier, la position 
d'ecriture prend d'abord la valeur de la taille de l'i-nceud associe avant de faire l'ecriture. 
L' ecriture sur un descripteur en mode 0_APPEND est done atomiquement constitute d'un depla- 
cement de la position courante en fin de fichier, suivi de l'envoi effectif des donnees. Ceci est 
tres important si deux processus ou plus essayent d'ecrire simultanement en fin du meme 
fichier. lis ne risquent pas d'etre interrompus entre le moment du positionnement en fin de 
fichier et l'ecriture proprement dite, comme cela pourrait etre le cas avec une implementation 
naive : 

Iseek (fd, 0, SEEK_END) ; 
write (fd, bloc, taille); 

L'utilisation de 0_APPEND est done parfaitement adaptee a la construction de fichiers de journa- 
lisation memorisant les evenements survenus dans plusieurs processus concurrents. Ceci est 
egalement vrai avec les flux ouverts en mode « a » ou « a+ », qui permettent d'employer la 
fonction fprintfO pour ecrire plus facilement des messages comprenant la valeur de 
certaines variables. Par contre, il faut savoir que deux ecritures successives peuvent etre sepa- 
rees dans le fichier par des donnees provenant d'un autre processus. 

Finalement, l'appel-systeme write ( ) peut egalement s' assurer que les donnees sont immedia- 
tement transmises au disque si le mode d'utilisation du descripteur contient l'option 0_SYNC. 
Dans ce cas, le noyau demande le stockage immediat des informations, y compris celles qui 
correspondent a la structure meme du fichier (l'i-nceud). Bien entendu cette option diminue 
considerablement les performances du programme. Elle ne doit etre employee que dans des 
cas particulierement rares (systeme d'enregistrement embarque de type « boite noire » par 
exemple). Les differents processus qui accedent a un fichier ont de toute maniere une vision 
coherente de celui-ci, et il n'est pas necessaire d'utiliser 0_SYNC pour d'autres besoins que la 
gestion des cas d' arrets critiques. 
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Dans le meme ordre d'idees, l'appel-systeme fsync( ) permet de demander la mise a jour des 
informations sur le disque de maniere ponctuelle. II est declare ainsi dans <uni std . h> : 

int fsync (int fd); 

On lui transmet simplement le descripteur du fichier a reecrire, et il renvoie 0 s'il reussit ou -1 
s'il echoue. En ce cas, errno peut indiquer une erreur d' entree-sortie grave avec le code EIO. 
Ceci peut arriver en cas de retrait inattendu d'un support amovible comme une disquette. 
L'appel-systeme syncO, qui ne prend pas d'argument, sert a synchroniser l'ensemble des 
donnees en attente d'ecriture differee. Nous avons deja evoque cet appel-systeme en detaillant 
le fonctionnement des buffers associes aux flux. 

Lorsque writeO reussit, il transmet le nombre d'octets ecrits. Si une erreur s'est produite, 
write( ) renvoie -1, et on peut analyser errno. 

II est tres important de verifier le code de retour de chaque ecriture. Quel que soit le disque 
dur utilise, une seule chose est a peu pres sure, c'est qu'un jour ou l'autre il sera sature. Cela 
peut se produire de maniere tout a fait accidentelle. Voici une anecdote qui m'est arrivee il y 
a quelques semaines, qui illustre bien ce cas de figure. Apres une modification de configura- 
tion de l'environnement Kde, celui-ci tentait de jouer des fichiers sonores pour la plupart des 
evenements (ouverture d'une fenetre, mise en icone. . .). Malheureusement, pour une question 
de droit d'acces au peripherique sonore, le gestionnaire audio ne pouvait arriver a jouer ses 
echantillons et affichait un message sur stderr. Ce message etait, comme d'habitude, redirige 
vers le fichier .xsession-errors, auquel evidemment personne ne fait attention, d'autant 
qu'il n'apparait pas dans un Is -1 . Au bout de quelques jours de travail sans deconnexion, 
l'ensemble des messages d'erreur produits a chaque evenement du gestionnaire de fenetres 
representait un fichier .xsession-errors de plus de 600 Mo ! La partition correspondant au 
repertoire /home etant deja assez chargee, elle s'est trouvee saturee. 

Le traitement de texte que j'utilisais a ce moment-la m'a indique que, le disque etant plein, il 
etait oblige de desactiver les sauvegardes regulieres automatiques. Cet avertissement 
precieux, attirant mon attention, a prouve ainsi qu'aucune verification du code de retour 
d'une ecriture ne doit etre negligee, y compris dans les fonctionnalites annexes comme les 
sauvegardes automatiques. 

Une application bien concue doit etre prete a resister aux erreurs les plus farfelues de l'utili- 
sateur : 

• Tentative de sauvegarde dans un repertoire correspondant a un CD-Rom. 

• Extraction inopinee d'une disquette ou d'une cle USB en cours d'ecriture. 

• Administrateur systeme debutant ayant efface par megarde le nceud special /dev/nul 1 qui 
sera recree automatiquement en tant que fichier normal par la premiere redirection 
executee par root, et qui remplira peu a peu la partition racine du systeme de fichiers. 

Ceci sans compter tous les problemes qui peuvent se poser avec un systeme de fichiers monte 
par NFS, au gre des caprices du reseau, de 1' alimentation electrique et de 1' administrateur 
systeme distant. 

La robustesse d'un programme dependra done de sa capacite a detecter au plus tot les erreurs 
et a diagnostiquer correctement les problemes pour proposer a l'utilisateur de remedier au 
defaut avant de recommencer la sauvegarde. La situation de la detection d'erreur au cours 
d'un write( ) est beaucoup plus cruciale que pendant un read( ), car l'application est alors en 
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possession de donnees non sauvegardees, qui peuvent representer plusieurs heures de travail 
et qu'il faut absolument arriver a enregistrer. II est hors de question que tout se termine tragi- 
quement avec un simple message d'erreur. 

Les situations d'erreur susceptibles d'etre reperees lors d'un appel write ( ) varient en fonc- 
tion du type de descripteur utilise. Nous pouvons toutefois resumer quelques scenarios classi- 
ques a prendre en consideration : 

• Le systeme de fichiers correspondant au descripteur ouvert est sature. L' appel writeO 
renvoie le nombre d'octets qu'il a ecrits. S'il n'en a ecrit aucun, il renvoie -1 et errno 
contient l'erreur ENOSPC. 

• Le fichier represente par le descripteur a depasse la limite maximale autorisee pour l'utili- 
sateur. Nous verrons un exemple plus bas. L' appel writeO renvoie le nombre d'octets 
ecrits. Si aucun caractere n'est ecrit, le processus recoit le signal SIGXFSZ. Si ce signal est 
intercepte ou ignore, write( ) renvoie -1 et errno contient EFBIG. 

• Une erreur physique s'est produite sur le disque ou l'utilisateur a inconsiderement extrait 
la disquette de sauvegarde avant la fin du transfert. L'appel-systeme write( ) echoue done 
avec une erreur EIO. 

• Le descripteur correspond a un tube ou a une socket connectee. Le processus lecteur a 
ferme 1' autre extremite du tube ou la connexion reseau est rompue. Le processus recoit 
alors un signal SIGPIPE. S'il ignore ou intercepte ce signal, writeO renvoie -1 et errno 
contient EPIPE. 

Tout comme nous l'avions observe avec readO, il existe des situations d'echec de writeO 
moins tragiques que les precedentes. Dans ce cas, on peut recommencer la tentative : 

• L'ecriture se fait dans un descripteur de type socket ou tube, qu'on a bascule en mode non 
bloquant. Si le descripteur est plein, l'appel-systeme write( ) echoue et declenche l'erreur 
EAGAIN en attendant qu'un processus lise les donnees deja enregistrees. 

• Durant l'ecriture, un signal a ete recu alors qu'aucune donnee n'avait ete ecrite. Dans ce 
cas, write( ) renvoie -1 et place EINTR dans errno. 

• On tente d'ecrire dans une portion de fichier sur laquelle un autre processus vient de placer 
un verrouillage strict, comme nous le verrons plus loin. L'ecriture echoue alors avec une 
erreur EAGAIN. 

On remarquera qu'en cas d'echec de writeO avec une erreur EAGAIN, il est probablement 
inutile de reessayer immediatement l'ecriture. II vaut mieux laisser un peu de temps au 
processus lecteur pour vider le tube plein, ou a celui qui a verrouille le fichier pour ecrire ses 
donnees. On evitera done de faire une boucle du type : 

while ((nb_ecrits = write(fd, buffer, taille)) == -1) 
if ((errno != EINTR) && (errno != EAGAIN)) 
break; 

Cette boucle consomme inutilement du temps processeur. II est preferable que le processus 
appelant se mette quelques instants en sommeil, en cas d'erreur EAGAIN, avant de recom- 
mencer sa tentative. Le code suivant est deja preferable. 

while ((nb_ecrits = write(fd, buffer, taille)) == -1) { 
if (errno == EINTR) 
continue; 



Descripteurs de fichiers 

Chapitre 19 



if (errno != EAGAIN) 

break; 
sleep(l) ; 

Une autre solution encore plus performante peut etre construite autour de l'appel-systeme 
selectC ), que nous etudierons dans le chapitre 30. 

Theoriquement, wri te ( ) ne peut pas renvoyer une valeur nulle, sauf si on lui a demande expli- 
citement d'ecrire 0 octet. Si l'appel-systeme a pu ecrire quelques caracteres avant qu'une 
erreur se produise, il renvoie ce nombre d'octets, sinon il renvoie -1. Si un programme est 
susceptible de recevoir des signaux tout en employant des appels-systeme write( ) pouvant 
bloquer (sockets, tubes...), il faut construire une boucle permettant d'envoyer toutes les 
donnees, eventuellement en plusieurs fois. 

On peut utiliser par exemple un code du genre : 
ssize_t 

mon_write (int fd, const void * buffer, size_t taille) 
{ 

const void * debut = buffer; 
size_t restant = taille; 

ssize_t ecrits = 0; 

while (restant > 0) { 

while ((ecrits = writetfd, debut, restant)) == -1) { 
if (errno == EINTR) 

continue; 
if (errno !=EAGAIN) 

return -1; 
sleep(l) ; 

} 

restant -= ecrits; 
debut += ecrits; 

} 

return taille; 

} 

Ceci, rappelons-le, ne concerne que des ecritures se faisant dans des descripteurs susceptibles 
de bloquer (sockets, tubes, files...) alors que le processus risque de recevoir des signaux 
utilises par F application. 

L' exemple suivant va mettre en relief le comportement de writeO lors d'une tentative de 
depassement de la taille maximale autorisee pour un fichier. Nous allons d'abord reduire la 
limite a une valeur plus faible et tenter des ecritures successives. Nous restreignons la limite 
FSIZE a une valeur qui n'est pas un multiple de la taille du buffer ecrit, afin d'obtenir en 
premier lieu un nombre d'octets ecrits inferieur a celui qui est attendu. A la tentative suivante, 
write( ) echouera en declenchant d'ailleurs le signal SIGXFSZ. 

exemple_write.c : 

#define _GNU_SOURCE 
#include <errno.h> 
#include <fcntl ,h> 
#include <signal .h> 
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//include <stdio.h> 

//include <stdlib.h> 

//include <string.h> 

//include <unistd.h> 

//include <sys/resource.h> 

//include <sys/stat.h> 

//include <sys/types.h> 

//define TAILLE_BLOC 1024 
//define DEPASSEMENT 767 

void 

gestionnaire (int numero) 
{ 

fprintf (stderr, "Signal %d regu : %s\n", numero, strsignal (numero) ) ; 

} 

int 
main (void) 
{ 

struct rlimit limite; 

int fd; 

char bloc[TAILLE_BLOC]; 

int nb_ecrits; 



signal (SIGXFSZ, gestionnaire) ; 



if (getrlimit(RLIMIT_FSIZE, & limite) != 0) { 
perror( "getrl imi t" ) ; 
exit(EXIT_FAILURE); 

} 

limite.rlim_cur = 3 * TAILLE_BLOC + DEPASSEMENT; 
if (setrlimit(RLIMIT_FSIZE, & limite) != 0) { 

perror( "setrl imi t" ) ; 

exit(EXIT_FAILURE); 

} 

fd = openC'essai. write", 0_WR0NLY | 0_CREAT | 0_TRUNC, 0644); 
if (fd < 0) { 

perror( "open" ) ; 

exit(EXIT_FAILURE); 

} 

memset(bloc, 1, TAILLEJLOC) ; 
do { 

nb_ecrits = writetfd, bloc, TAILLEJLOC) ; 
if (nb_ecrits != TAILLE_BLOC) { 

fprintf (stderr, "nb_ecrits = %d\n", nb_ecrits); 
if (errno != 0) { 

fprintf (stderr, "errno = %d : ", errno); 
perrort "" ) ; 
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} while (nb_ecrits != -1); 
cl ose(fd) ; 

return EXIT_SUCCESS; 



L' execution suivante montre bien les deux appels write( ) qui echouent : le premier n'ecrit 
que 767 octets au lieu des 1 024 attendus. Le second appel declenche SIGXFSZ et renvoie — 1, 
et errno est correctement remplie. 

$ ./exemple_write 

nb_ecrits = 767 

Signal 25 regu : Debordement de la taille permise pour un fichier 
nb_ecrits = -1 

errno = 27 : Fichier trop gros 
$ 

Les deux autres fonctions permettant d'ecrire dans un descripteur sont writev( ) et pwritet ). 
L appel-systeme writevO est symetrique a readvO ; il permet d'ecrire une succession de 
valeurs en un seul appel. Son prototype est defini dans <sys/uio.h>. Les conditions d'echec 
sont les memes que celles de write ( ). 

Pour que pwri te( ) soit declare dans <uni std. h>, il faut definir la constante symbolique _X0PEN_ 
SOURCE et lui dormer la valeur 500 avant l'inclusion du fichier d'en-tete. Cet appel-systeme 
fonctionne comme writeO mais en effectuant Fecriture a la position indiquee en dernier 
argument et sans modifier la position courante du descripteur. En plus des conditions d'echec 
identiques a celles de writeO s'ajoutent celles de 1' appel-systeme de positionnement que 
nous allons voir a present. Comme son homologue pread( ), cet appel-systeme sert surtout a 
implementer les entrees-sorties asynchrones. 



II n'existe qu'un seul appel-systeme, nomme 1 seek( ) , permettant de consulter ou de modifier 
la position courante dans un descripteur de fichier. Son prototype est declare dans <uni std . h> : 



Le type off_t est defini dans <sys/types . h> et correspond sur la plupart des systemes a un 
long int. 

Cette fonction permet de deplacer la position courante dans le descripteur a la nouvelle valeur 
indiquee en second argument. Le point de depart, fourni en troisieme argument, peut prendre 
comme avec f seek( ) l'une des valeurs suivantes : SEEK_SET, SEEK_CUR ou SEEK_END. Cet appel- 
systeme renvoie la nouvelle position, mesuree en octets depuis le debut du fichier, ou -1 en 
cas d'erreur. Pour connaitre la position courante, il suffit done d'utiliser 1 seek (fd, 0, SEEK_ 
CUR). 

Nous avons deja indique que le positionnement dans un descripteur est memorise dans la 
table des fichiers et non dans la table des descripteurs. Si un processus ouvre un descripteur 
avant d'invoquer f ork( ), il partagera avec son fils la structure f i 1 e de la table des fichiers. Le 
positionnement sera done commun aux deux processus, tel que l'indique l'exemple ci-apres, 
dans lequel nous avons supprime toutes les verifications d'erreur en retour de 1 seek( ), afin de 
simplifier le listing. 



Positionnement dans un descripteur de fichier 



■ 



off_t lseek (int descripteur. off_t position, int debut); 
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exemple lseek.c : 

#incl ude <fcntl .h> 

//include <stdio.h> 

//include <stdlib.h> 

//include <unistd.h> 

//include <sys/types.h> 

//include <sys/stat.h> 

//include <sys/wait.h> 



int 
main (void) 
{ 

int fd; 

pi d_t pid_fils; 

off_t position; 



fd = open( "essai . 1 seek" , 
if (fd < 0) { 

perror( "open" ) ; 

exit(EXIT_FAILURE); 



0_RDWR I 0_CREAT I 0_TRUNC, 0644); 



/* On ecrit quelques octets */ 

if (write(fd, "ABCDEFGHIJ" , 10) != 10) { 

perror( "write" ) ; 

exit(EXIT_FAILURE); 

} 

/* Puis on separe les processus */ 
if ((pid_fils = forkO) < 0) { 

perror( "fork" ) ; 

exit(EXIT_FAILURE); 



if (pid_fils) { 

/* Processus pere */ 
position = lseek(fd, 0, 
fprintf (stderr, "Pere : 
sleep(l) ; 

position = lseek(fd, 0, 
fprintf (stderr, "Pere 
lseek(fd, 5, SEEK_SET) 
fprintf (stderr, "Pere 
waitpid(pid_fils, NULL, 
} else { 

/* Processus fils */ 
position = lseek(fd, 0, 
fprintf (stderr, "Fils 
lseek(fd, 2, SEEK_SET) 
fprintf (stderr, "Fils 
sleep(2) ; 

position = lseek(fd, 0 
fprintf (stderr, "Fils 



SEEK_CUR); 

position = %~\d \n", position); 
SEEK_CUR); 

position = £ld \n", position); 

deplacement en position 5\n"); 
0); 



SEEK_CUR); 

position = %ld \n", position); 
deplacement en position 2\n"); 
SEEK_CUR); 

position = %ld \n", position); 
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close(fd); 

return EXIT_SUCCESS; 

> 

Dans cet exemple le processus pere et le fils modifient altemativement la position d'un 
descripteur. Nous voyons que les deplacements effectues dans un processus sont immediate- 
ment repercutes dans F autre : 

$ ./exemple_lseek 

Pere : position = 10 

Fils : position = 10 

Fils : emplacement en position 2 

Pere : position = 2 

Pere : emplacement en position 5 

Fils : position = 5 



Figure 19.3 
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processus pere etfils 



table des descripteurs 
du processus pere 
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fd 











table des descripteurs 
du processus fils 



0 




1 








fd 









struct files struct 



table des fichiers 



table des i_nceuds 
du systeme 



mode lecture 



position 0 



i nceud 



"./essai.lseek" 



taille 10 



struct inode 



II est important de remarquer que l'utilisation de 1 seek( ) n'implique aucune entree-sortie sur 
le systeme de fichier correspondant au descripteur. II ne s'agit que de la consultation ou de la 
modification d'un champ de la structure f i 1 e, mais pas d'un acces reel au fichier. L'emploi de 
1 seek( ) n'est done pas exigeant en termes de performances (mis a part le cout d'un appel- 
systeme) ; il ne risque pas de bloquer, mais ne fournit pas non plus de reelle information sur 
l'etat du fichier correspondant. Les erreurs devront etre detectees dans les appels-systeme 
read( ), write( ) ou close( ) suivants. 



Manipulation et duplication de descripteurs 

Nous avons observe qu'en cas d'utilisation de fork( ), la table des descripteurs correspondant 
au processus pere est copiee dans l'environnement du processus fils, mais que la structure 
f i 1 e est commune aux deux processus. 
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Un processus peut aussi employer les appels-systeme dup() ou dup2() pour obtenir une 
seconde copie d'un descripteur ouvert, pointant sur la meme structure file que 1' original. 
L'interet principal de ce mecanisme est de pouvoir modifier les descripteurs d' entree et de 
sortie standard, en utilisant des sockets ou des tubes par exemple. Les prototypes de ces 
appels-systeme sont declares dans <uni std . h> : 

int dup (int descripteur); 

int dup2 (int descripteur, int nouveau); 

La fonction dup( ) permet d' obtenir une copie du descripteur fourni en argument. Cet appel- 
systeme garantit que le numero renvoye sera le premier disponible dans la table des descrip- 
teurs du processus. Nous savons par ailleurs que par tradition les numeros de descripteur de 
stdi n, stdout et stderr sont les trois premiers de cette table. Ainsi nous pouvons rediriger la 
sortie standard, par exemple dans un fichier, en utilisant le code suivant : 

fd = open(fichier, . . . ) 

close(STDOUT_FILENO); 
dup(fd); 

Le premier numero libre sera celui du descripteur de stdout une fois que celui-ci sera referme. 
Lappel dup( ) permettra done de le reaffecter. Nous avons deja vu ce genre de comportement 
avec f reopen( ) et les flux, mais Favantage de dup( ) est de permettre la redirection vers des 
sockets, des tubes, des files, bref tous les elements utilisables par le noyau sous forme de 
descripteurs. 

Nous allons dans l'exemple suivant nous contenter d'un dup( ) sur un descripteur de fichier, 
qu'on met en place sur stdout, avant d'invoquer 1 s. L'affichage de ce dernier programme est 
done redirige vers le fichier desire. 

exemple_dup.c 

#incl ude <fcntl .h> 
#include <unistd.h> 
#include <stdio.h> 
#include <stdlib.h> 

int 
main (void) 
{ 

int fd; 

fd = openC'essai .dup", 0_RDWR | CLCREAT | 0_TRUNC, 0644); 
if (fd < 0) { 

perror( "open" ) ; 

exit(EXIT_FAILURE); 

} 

close(STD0UT_FILEN0); 
if (dup(fd) < 0) { 

perrort "dup" ) ; 

exit(EXIT_FAILURE); 

} 

close(fd); 

execlpC'ls", "Is", NULL); 
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perrorC'execlp") ; 
exit(EXIT_FAILURE); 

Nous voyons que la redirection a effectivement lieu : 

$ ./exemple_dup 
$ cat essai .dup 

Makefi 1 e 
cree_core.c 
essai .dup 
exemple_buffers.c 
exempl e_dup 
exemple_dup.c 
exempl e_enum.c 
exempl e_f open. c 
exempl e_f reopen. c 
exemple_fseeko.c 
exempl e_f seeko_2 . c 
exempl e_ftel 1 .c 
exempl e_fwrite.c 
exempl e_l seek. c 
exempl e_mon_wri te . c 
exempl e_open.c 
exempl e_open_2.c 
exempl e_open_3.c 
exempl e_write.c 
$ 



Figure 19.4 

Duplication d'un 
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fd 
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table des fichiers 



mode lecture 



position 0 



i nceud 




table des i-nceuds 
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"./essai.dup" j 



taille 0 



struct inode 



struct file 



Le defaut de ce procede reside dans le risque qu'un signal interrompe le processus entre la 
fermeture du descripteur a rediriger et la duplication du descripteur cible. Si le gestionnaire 
de ce signal utilise un appel-systeme open( ), create ), pi pe( ) ou socket ( ) par exemple, il va 
occuper la place qu'on reservait pour la redirection. Aussi le noyau met-il a notre disposition 
un appel-systeme dup2( ) qui effectue la redirection complete de maniere atomique. 

L' invocation de : 
dup2 (fd, ancien); 
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permet de fermer le descripteur ancien s'il est ouvert, puis de dupliquer fd en lui associant 
une nouvelle entree a la position ancien dans la table des descripteurs. Cette methode est done 
plus fiable en ce qui concerne le risque d' interruption par un signal, mais elle permet aussi de 
rediriger a coup sur le descripteur voulu, sans presumer de la numerotation effective des 
descripteurs de stdin, stdout et stderr. 

Les programmes offrant des services reseau peuvent choisir d'utiliser leur propre systeme de 
connexion, construisant une socket et restant a l'ecoute des demandes des clients, ou 
d'employer les services du demon inetd, souvent sumomme le superserveur reseau. Celui-ci 
gere automatiquement la mise en place d'un serveur sur un port precise dans le fichier de 
configuration /etc/inetd.conf. Lorsqu'un client etablit une connexion, inetd se duplique en 
utilisant fork( ) afin de relancer l'ecoute en attente d'un autre client. Le processus fils redi- 
rige, avec l'appel-systeme dup2(), son entree et sa sortie standard vers la socket obtenue, 
avant de faire appel a exec( ) pour lancer 1' application prevue. Celle-ci peut alors travailler 
directement stdin et stdout sans se soucier des details de la programmation reseau. 

Les appels-systeme dup( ), comme dup2( ) , renvoient le nouveau descripteur obtenu, ou -1 en 
cas d'erreur. II existe une difference entre la copie du descripteur et l'original. La table des 
descripteurs contient en effet un attribut supplementaire qui est remis a zero lors de la dupli- 
cation : 1' attribut close-on-exec. Lorsqu'un processus invoque un appel-systeme de la famille 
exec ( ) pour lancer un autre programme, les descripteurs pour lesquels cet attribut est valide 
sont automatiquement fermes. L attribut close-on-exec est remis a zero de facon automatique 
lors d'une duplication, ce qui nous arrange puisqu'on utilise generalement dup() ou dup2() 
pour transmettre un fichier ouvert a un processus qu'on veut executer. 

La modification de 1' attribut close-on-exec peut se faire, entre autres, a l'aide de l'appel- 
systeme f cntl ( ) qui permet de consulter ou de parametrer plusieurs aspects d'un descripteur. 
Cette fonction est declaree dans <f cntl . h> ainsi : 

int fcntl (int descripteur, int commande, ...); 

Les points de suspension finals indiquent que des arguments supplementaires peuvent etre 
ajoutes, en fonction de la commande invoquee. Les commandes disponibles sont variees : 

Duplication de descripteur 

Avec la commande F_DUPFD, fcntl ( ) permet de dupliquer un descripteur a la maniere de 
dup( ) ou de dup2( ). Cette commande prend en troisieme argument un numero. Elle duplique 
le descripteur transmis en premier argument et lui attribue le premier emplacement libre de la 
table des descripteurs qui soit superieur ou egal au numero passe en troisieme argument. 

Ainsi : 

fcntl (fd, F_DUPFP, 0); 
est equivalent a : 

dup (fd); 

car il recherche le plus petit descripteur libre. De meme : 

close (ancien); 

fcntl (fd, F_DUPFD, ancien); 



Descripteurs de fichiers 




Chapitre 19 



est equivalent a : 
dup2 (fd, ancien); 



sauf que dup2( ) renvoie EBADF si ancien n'est pas dans les valeurs correctes pour un descrip- 
teur, alors que fcntl ( ) renvoie EINVAL 

Acces aux attributs du descripteur 

Les commandes F_GETFD et F_SETFD permettent de consulter ou de modifier les attributs du 
descripteur de fichier. De maniere portable il n'existe qu'un seul attribut, close-on-exec, 
qu'on represente par la constante FD_CLOEXEC. Cet attribut est efface par defaut lors de l'ouver- 
ture d'un descripteur. 

On peut activer l'attribut close-on-exec d'un descripteur en utilisant : 

etat = fcntl (fd, F_GETFD); 

etat |= FD_CLOEXEC; 

fcntl (fd, F_SETFD, etat); 

Le programme ci-dessous ouvre un descripteur de fichier puis, en fonction de son argument 
en ligne de commande, bascule l'attribut close-on-exec du descripteur. Ensuite on invoque 
l'utilitaire fuser en lui indiquant le nom du fichier ouvert. Cette application permet de 
connaitre le PID du ou des processus ayant ouvert le fichier. 

exemple_fcntl.c : 

#include <fcntl .h> 

#include <stdio.h> 

#include <string.h> 

#include <unistd.h> 

#include <sys/types.h> 

int 

main (int argc, char * argv[]) 
{ 



int fd; 
int etat; 

if ((argc != 2) 
|| ( (strcasecmp(argv[l] , "ferine") != 0) 
&& (strcasecmp(argv[l] , "laisse") != 0))) { 
fprintf (stderr, "syntaxe : %s [ferine | laisse]\n", argv[0]); 
exit(EXIT_FAILURE); 



fd = openC'essai .fcntl", 0_RDWR | 0_CREAT | 0_TRUNC, 0644); 
if (fd < 0) { 

perrorC'open"); 

exi t( EXIT_FAI LURE) ; 



if ((etat = fcntKfd, F_GETFD) ) < 0) { 
perror( "fcntl " ) ; 
exi t( EXIT_FAI LURE) ; 
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if (strcasecmp(argv[l] , "ferine") == 0) 
etat |= FD_CL0EXEC; 

el se 

etat &= ~FD_CL0EXEC; 
if (fcntKfd, F_SETFD, etat) < 0) { 
perror( "fcntl " ) ; 
exit(EXIT_FAILURE); 

} 

execl p( "f user" , "fuser", "-a", "essai .fcntl " , NULL); 

perror( "execl p" ) ; 

exit(EXIT_FAILURE); 

} 

Lorsqu'on execute le programme avec l'argument « ferme », celui-ci active l'attribut close- 
on-exec du descripteur, ce qui declenchera la fermeture automatique avant d'invoquer fuser. 
Ce dernier nous signale done qu'aucun processus n'a ouvert le fichier. Par contre, si on 
fournit l'argument 1 ai sse, l'attribut est efface (son etat par defaut en fait), et le fichier ne sera 
done pas ferme avant d'executer fuser. Celui-ci detectera alors que le fichier est ouvert et affi- 
chera son propre PID. 

$ ./exemple_fcntl ferme 
essai .fcntl : 

No process references; use -v for the complete list 
$ ./exemple_fcntl laisse 
essai .fcntl : 4835 
$ 

Pour que cet exemple se deroule correctement, il faut que l'utilitaire fuser soit dans le chemin 
de recherche de execl p( ). Ceci necessite eventuellement de rajouter les repertoires /sbi n ou 
/usr/sbi n (ou se trouve generalement fuser) dans la variable d'environnement PATH de l'utili- 
sateur. 

Attributs du fichier 

Les attributs auxquels on peut acceder avec les commandes F_GETFL et F_SETFL sont ceux qui 
ont ete indiques lors de l'ouverture du fichier avec open( ). Ces attributs appartiennent a la 
structure f 1 1 e de la table des fichiers et sont done communs aux differents descripteurs qui 
pointent sur elle et qui sont obtenus a travers des appels dup( ) ou fork( ). 

Pour consulter le mode d'ouverture d'un fichier, il faut passer la valeur renvoyee a travers le 
masque 0_ACCM0DE, qui permet d'isoler les bits correspondant a 0_RDWR, 0_RD0NLY, OJtlRONLY. 
Le programme suivant permet d'examiner ces modes. 

exemplejcntl 2.c : 

#incl ude <fcntl .h> 
#include <stdio.h> 
//include <unistd.h> 

int 
main (void) 
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int etat; 

etat = fcntl ( STDI N_FI LENO , F_GETFL) & 0_ACCMODE; 
fprintf (stderr, "stdin : £s\n", 

(etat == 0_RDWR) ? "R/W" : (etat == 0_RD0NLY) ? "R" : "W"); 
etat = fcntl (STD0UT_FI LENO, F_GETFL) & 0_ACCMODE; 
fprintf (stderr, "stdout : Zs\n", 

(etat == 0_RDWR) ? "R/W" : (etat == 0_RD0NLY) ? "R" : "W"); 
etat = fcntl ( STDERR_FI LENO , F_GETFL) & 0_ACCMODE; 
fprintf (stderr, "stderr : £s\n", 

(etat == 0_RDWR) ? "R/W" : (etat == 0_RD0NLY) ? "R" : "W"); 
return EXIT_SUCCESS; 

} 

II est amusant de voir que le shell configure differemment les descripteurs des flux d' entree- 
sortie standard en fonction du fichier sous-jacent : 

$ ./exemple_fcntl_2 

stdin : R/W 
stdout : R/W 
stderr : R/W 

$ ./exemple_fcntl_2 < essai. fcntl 

stdin : R 
stdout : R/W 
stderr : R/W 

$ ./exemple_fcntl_2 > esssi. fcntl 

stdin : R/W 
stdout : W 
stderr : R/W 
$ 

La commande F_SETFL ne permet de modifier que les autres elements du mode d'ouverture : 
0 APPEND etO NONBLOCK. 



Attention 

II est recommande d'utiliser d'abord la commande FJ3ETFL afin d'obtenir I'etat complet, puis d'y ajouter ou 
d'en extraire les constantes desirees avant d'invoquer la commande F_SETFL, contrairement a ce qui se fait 
trap souvent. 



Linteret de cette commande de modification concerne essentiellement les descripteurs qu'on 
obtient autrement qu'avec l'appel-systeme openO. Nous y reviendrons done plus en detail 
dans le chapitre concernant les communications entre processus. 

Quatre autres commandes seront etudiees avec les mecanismes d'entrees-sorties asynchrones 
puisqu'elles servent a configurer le ou les processus qui sont avertis par un signal lorsque des 
donnees sont pretes a etre lues : 

• Les commandes F_GET0WN et F_SET0WN indiquent les processus concernes. 

• Les commandes F_GETSIG et F_SETSIG precisent le signal a utiliser. 
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Verrouillage d'un descripteur 

On peut verrouiller Faeces a un fichier pour en assurer l'exclusivite de deux manieres : avec 
la fonction flockO et avec les commandes F_GETLK, F_SETLK ou F_SETLKW de fcntl (). Ces 
deux methodes sont distinctes et n'ont pas de repercussions l'une sur Fautre. La commande 
f 1 ock( ) est un heritage BSD qu'il vaut mieux eviter de nos jours. 

II est possible, avec fcntl ( ) , de verrouiller une partie d'un fichier afin de garantir qu'un seul 
processus a la Ms pourra modifier cette portion. Ce verrouillage peut etre cooperatif, ce qui 
signifie que les processus doivent verifier eux-memes l'existence d'un verrou et s'abstenir de 
faire des modifications s'ils en trouvent un. C'est le seul comportement veritablement defini 
par Posix. Le defaut de ce mecanisme est l'impossibilite de se premunir des modifications 
sauvages effectuees par un processus ne se pliant pas a l'autorite du verrouillage. Pour cela, le 
noyau Linux implemente comme de nombreux autres systemes Unix un verrouillage strict. 
La portion de fichier ainsi bloquee est totalement immunisee contre les modifications par 
d'autres processus, meme s'ils sont executes par root. La distinction entre verrouillage coope- 
ratif et verrouillage strict se fait au niveau du fichier lui-meme, aussi etudierons-nous d'abord 
le principe du verrou cooperatif, puis nous verrons comment le transformer en verrou strict. 

Les verrous sont representes par des structures flock qui sont definies dans <fcntl . h>, avec 
les cinq membres suivants : 



Norn 


Type 


Utilisation 


l_type 


short int 


Ce membre indique le type de verrouillage. II peut s'agir de F_RDLCK pour un verrou en 
lecture, F_WRLCK pour un verrou en ecriture, ou FJJNLCK pour supprimer le verrou. 


l_whence 


short int 


On signale ainsi le point de depart de la mesure annongant le debut du verrouillage. 
1 C'est I'equivalent du troisieme argument de lseekO, qui peut prendre les valeurs 
SEEK_SET, SEEK_CUR 0U SEEK_END. 


1_start 


off_t 


Ce champ precise le debut de la portion verrouillee du fichier. 


l_len 


off_t 


Longueur de la partie a verrouiller dans le fichier, mesuree en octets. 


l_pid 


pi d_t 


Ce membre est rempli automatiquement par le systeme pour indiquer le processus 
detenteur d'un verrou. 



Le type de verrou, indique dans le premier membre de cette structure, a la signification 
suivante : 

• F_RDLCK : le processus demande un acces en lecture sur la portion concernee du fichier, en 
s'assurant ainsi qu'aucun autre processus ne viendra modifier la partie qu'il lit. Plusieurs 
processus peuvent disposer simultanement d'un verrouillage en lecture sur la meme portion 
de fichier. 

• F_WRLCK : le processus veut modifier une partie du fichier. II s'assure ainsi qu'aucun autre 
processus ne risque d'ecrire au meme endroit mais egalement qu'aucun ne tentera de 
verrouiller en lecture la portion concernee. 

Le comportement peut done etre resume ainsi : 

• Si une zone d'un fichier n'a aucun verrou, un processus pourra en placer un en lecture ou 
en ecriture. 
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• Si une zone est verrouillee en lecture, un autre verrou en lecture sera accepte, mais pas un 
verrou en ecriture. 

• Si une zone dispose d'un verrou en ecriture, aucun autre verrouillage ne sera accepte. 

Lorsqu'on parle de deux verrouillages sur la meme zone, il suffit en fait que les deux zones 
verrouillees aient une intersection non vide. Le noyau verifie en effet les superpositions des 
portions demandees. 

Si on indique une longueur I Jen nulle, cela signifie « jusqu'a la fin du fichier ». Bien entendu, 
le point de depart peut etre place n'importe oil, eventuellement au debut si on veut verrouiller 
tout le fichier. Le verrouillage peut s'etendre au-dela de la fin du fichier si on desire y inscrire 
de nouvelles donnees. 

Pour placer un verrou sur une portion d'un fichier, on peut employer les commandes F_SETLK 
ou F_SETLKW de fcntl (). Cette derniere commande est bloquante (W signifie wait). L'appel- 
systeme fcntl ( ) reste bloque dans ce cas si un verrou est deja present, jusqu'a ce qu'il soit 
retire. Cette fonction est toutefois interruptible par un signal, dans ce cas elle echoue et 
renvoie EINTR. La commande F_SETLK ne reste pas bloquee mais peut renvoyer EACCES ou 
EAGAIN suivant le type de verrouillage deja present. Voici done deux methodes de verrouillage 
en ecriture de 1' ensemble du fichier. 

struct flock lock; 
char chaine[2]; 

lock.l_type = F_WRLCK; 
lock.l_whence = SEEK_SET; 
lock.l_start = 0; 
lock.l_len = 0; 

while (fcntl (fd, F_SETLK, & lock) < 0) { 

fprintf (stdout, "Fichier verrouille, reessayer ? "); 

fgetstchaine, 2, stdin); 

if (toupper(chaine[0]) == '0') 

continue; 
return -1; 



fcntl (fd. FJJNLCK, & lock); 
return 0; 

Voici a present l'attente bloquante : 

struct flock lock; 
char chaine[2]; 

lock.l_type = F_WRLCK; 
lock.l_whence = SEEK_SET; 
lock.l_start = 0; 
lock.l_len = 0; 



/* Ici l'acces est autorise, */ 
/* on peut faire les modifications, */ 
/* puis liberer le verrou */ 



while (fcntl (fd, F_SETLKW, & lock) < 0) 
if (errno != EINTR) 
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return -1; 

/* Ici l'acces est autorise, */ 
/* on peut faire les modifications, */ 
/* puis liberer le verrou */ 
fcntKfd, F_L)NLCK, & lock); 
return 0; 

On peut aussi demander l'etat du verrouillage sur un fichier en utilisant la commande F_GETLK, 
le troisieme argument etant un pointeur sur une structure flock, comme avec F_SETLK. Cette 
structure sera modifiee au cours de l'appel pour representer le verrou actuellement actif qui 
bloque l'acces a la portion voulue. Si aucun verrou n'est present, le membre l_type est alors 
rempli avec la valeur F_UNLCK. Cette commande ne doit etre utilisee qu'avec precaution, car 
l'etat du fichier peut tres bien etre modifie entre le retour de l'appel-systeme fcntlO et 
l'instruction suivante. II ne faut s'en servir qu'a titre indicatif, notamment pour connaitre le 
PID du processus tenant le fichier, comme dans cette attente non bloquante : 

struct f 1 ock actuel ; 



while (fcntKfd, F_SETLK, & lock) < 0) { 

/* Copier le verrou voulu dans la structure servant */ 
/* pour 1 'interrogation */ 
memcpy(& actuel, & lock, sizeof (struct flock)); 
/* Interroger le noyau sur le verrouillage */ 
if (fcntKfd, F_GETLK, & actuel) < 0) 

continue; 
if (actuel .l_type == FJJNLCK) 

/* Le verrou a ete supprime entre temps */ 

continue; 

fprintf (stdout, "Fichier verrouille par processus %d, reessayer ?", 

actuel .l_pid) ; 
fgets(chaine, 2, stdin); 
if (toupper(chaine[0]) == '0') 

continue; 
return -1; 

} 

II existe des situations oil le verrouillage d'un descripteur conduit a un interblocage de deux 
processus. Supposons en effet que chaque processus a verrouille une partie d'un fichier et 
reclame chacun un second verrou sur la partie tenue par 1' autre. On arrive a une situation de 
blocage « a mort » que le noyau doit detecter et essayer d'eviter. Ceci peut se produire notam- 
ment quand plusieurs copies d'un meme processus tentent simultanement d'ajouter des 
donnees a la fin d'un fichier et de mettre a jour une table des matieres situee au debut. Dans 
un tel cas, le noyau fait echouer la tentative de verrouillage avec l'erreur EDEADLK (dead lock), 
comme nous allons le voir avec l'exemple suivant. 

exemple_fcntl_3.c : 

#include <fcntl .h> 
#include <stdio.h> 
#include <stdlib.h> 
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#include <unistd.h> 
#include <sys/wait.h> 



i nt 
main (void) 

{ 

int fd; 
pid_t pid; 
struct flock lock; 



/* Creation d'un fichier avec quelques donnees */ 

fd = openC'essai .fcntl", 0_RDWR | 0_CREAT | 0_TRUNC, 0644) 

if (fd < 0){ 

perror( "open" ) ; 

exi t( EXIT_FAI LURE) ; 

} 

writetfd, "ABCDEFGHIJKLMNOPQRSTUVWXYZ" , 26); 
if ((pid = forkO) == 0) { 

fprintf (stderr, "FILS : Verrou en Lecture de 0-l-2\n"); 

lock.l_type = F_RDLCK; 

lock.l_whence = SEEK_SET; 

lock.l_start = 0; 

lock.l_len = 3; 

if (fcntl (fd, F_SETLKW, & lock) < 0) 
perror( "FILS" ) ; 

el se 

fprintf(stderr, "FILS : 0k\n"); 
sleep(l) ; 

fprintf(stderr, "FILS : Verrou en Ecriture de 20-21-22\n" ) ; 
lock.l_type = F_WRLCK; 
lock.l_whence = SEEK_SET; 
lock.l_start = 20; 
lock.l_len = 3; 

if (fcntl (fd, F_SETLKW, & lock) < 0) 
perror( "FILS" ) ; 

el se 

fprintf (stderr, "FILS : 0k\n"); 
sleep(2) ; 
} else { 

fprintf (stderr, "PERE : Verrou en Lecture de 18-19-20\n" ) ; 
lock.l_type = F_RDLCK; 
lock.l_whence = SEEK_SET; 
lock.l_start = 18; 
lock.l_len = 3; 

if (fcntl (fd, F_SETLKW, & lock) < 0) 
perror( "PERE" ) ; 

el se 

fprintf (stderr, "PERE : 0k\n"); 
sleep(2) ; 

fprintf (stderr, "PERE : Verrou en Ecriture de 2-3\n"); 
lock.l_type = F_WRLCK; 
lock.l_whence = SEEK_SET; 
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1 ock. l_start = 2; 
lock.ljen = 2; 

if (fcntKfd, F_SETLKW, & lock) < 0) 
perrort "PERE" ) ; 

el se 

fprintftstderr, "PERE : 0k\n"); 
fprintf (stderr, "PERE : Liberation du verrou 18-19-20\n" ) ; 
lock.l_type = F_UN LCK ; 
lock.l_whence = SEEK_SET; 
lock.l_start = 18; 
lock.l_len = 3; 

if (fcntKfd, F_SETLKW, & lock) < 0) 
perror( "PERE" ) ; 

el se 

fprintf(stderr, "PERE : 0k\n"); 
waitpid(pid, NULL, 0); 

} 

return EXIT_SUCCESS; 

} 

Nous remarquons que les zones verrouillees par les deux processus ne coincident pas tout a 
fait, elles ont simplement des intersections communes. 



Figure 19.5 
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L' execution montre bien que le noyau detecte un risque de blocage complet et fait echouer un 
appel-systeme f cntl ( ) : 



$ ./exemple_fcntl_3 
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Encore une fois, nous nous sommes contente d'utiliser des sommeils si eep( ) pour synchro- 
niser les differentes phases des processus, ce qui ne fonctionne veritablement que sur un 
systeme peu charge, mais permet de conserver des exemples assez simples. La detection des 
situations de blocage complet est assez performante puisqu'elle marche egalement quand de 
multiples processus tiennent chacun un maillon d'une chaine en attendant la liberation du 
suivant. Nous allons le demontrer en implementant de maniere simplifiee le fameux repas des 
philosophes, presente par Dijkstra. Nous asseyons n philosophes autour d'une table, chacun 
ayant une assiette de spaghettis devant lui. II y a n fourchettes sur la table, une entre chaque 
assiette, et on considere que pour manger des spaghettis, il faut deux fourchettes. Plusieurs 
difficultes peuvent etre mises en relief avec ce probleme classique, mais nous allons simple- 
ment montrer une situation de blocage oil chaque philosophe prend la fourchette a gauche de 
son assiette, puis attend que la fourchette de droite soit libre. Bien sur, ils restent tous en 
attente si le noyau ne detecte pas le blocage. 

exemple_fcntl_4.c : 

#include <fcntl .h> 

#include <stdio.h> 

^include <stdlib.h> 

#include <unistd.h> 

#include <sys/wait.h> 



void philosophe (int numero, int total, int fd); 



int 

main (int argc, char * argv[]) 



int n; 
int i; 
int fd; 



if ((argc != 2) || (sscanf (argv[l] , "M", & n) != 1 ) ) { 

fprintf (stderr, "Syntaxe : %s nb_phi 1 osophes\n" , argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

fd = openC'essai .fcntl", 0_RDWR | 0_CREAT | 0_TRUNC, 0644); 
if (fd < 0){ 

perrorC'open"); 

exi t(EXIT_FAI LURE); 

} 

for (i = 0; i < n; i ++) 

writetfd, "X", 1); 
for (i = 0; i < n; i ++) { 

if (forkO != 0) 
continue; 

philosophed' , n, fd); 

exit(EXIT_SUCCESS); 

} 

for (i = 0; i < n; i ++) 

wait(NULL); 
return EXIT_SUCCESS; 
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void 

philosophe (int numero, int total, int fd) 
{ 

struct flock lock; 
char nom[10]; 

sprintf(nom, "FILS %d", numero); 

lock.l_type = F_WRLCK; 
lock.l_whence = SEEK_SET; 
lock.l_len = 1; 
lock.l_start = numero; 

fprintf (stderr, "Is : fourchette gauche (%ld)\n", 

nom, lock . l_start); 
if (fcntKfd, F_SETLKW, & lock) < 0) 
perror(nom) ; 

el se 

fprintf (stderr, "%s : 0k\n", nom); 
sleep(l) ; 

lock.l_start = (numero + 1) t total; 

fprintf (stderr, "Is : fourchette droite (%ld)\n", 

nom, lock . l_start); 
if (fcntKfd, F_SETLKW, & lock) < 0) 
perror(nom) ; 

el se 

fprintf (stderr, "%s : 0k\n", nom); 
sleep(l) ; 

lock.l_type = F_UNLCK; 

fprintf (stderr, "%s : repose fourchette ( % 1 d ) \ n " , 

nom, lock . l_start); 
fcntKfd, F_SETLKW, & lock); 
lock.l_start = numero; 

fprintf (stderr, "Is : repose fourchette ( % 1 d ) \ n " , 

nom, lock . l_start); 
fcntKfd, F_SETLKW, & lock); 

} 

On remarquera au passage que le blocage peut etre evite en ne prenant pas systematiquement 
les fourchettes dans l'ordre gauche-droite, mais en prenant celles de rang pair en premier, puis 
celles de rang impair. Ici, le blocage est bien detecte par le noyau : 

$ ./exemple_fcntl_4 

Syntaxe : ./exemple_fcntl_4 nb_philosophes 
$ ./exemple_fcntl_4 4 
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0 


fourchette droite 


(1) 


ILS 


1 


fourchette droite 
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fourchette droite 
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ILS 


3 


fourchette droite 


(0) 


ILS 
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ILS 


3 


repose 


fourchette 
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ILS 


3 


repose 


fourchette 


(3) 


ILS 


2 


Ok 






ILS 


2 


repose 


fourchette 


(3) 


ILS 


2 


repose 


fourchette 


(2) 


ILS 


1 


Ok 






ILS 


1 


repose 


fourchette 


(2) 


ILS 


1 


repose 


fourchette 


(1) 


ILS 


0 


Ok 






ILS 


0 


repose 


fourchette 


(1) 


ILS 


0 


repose 


fourchette 


(0) 



$ 

Les verrouillages que nous avons vus jusqu'a present sont de type cooperatif, ce qui signifie 
que chaque processus desireux de modifier un fichier doit se discipliner et utiliser les proce- 
dures d'acces adequates. Aucune protection n'est assuree contre un processus qui outrepasse 
les verrouillages et modifie le fichier de maniere anarchique. Pour eviter cela, le noyau imple- 
mente un mecanisme de verrouillage strict. II suffit simplement de modifier le mode de 
protection du fichier et tous les verrouillages vus precedemment seront automatiquement 
renforces par le noyau. 

Un fichier est marque comme verrouillable de maniere stricte en modifiant les bits d'autorisa- 
tion pour positionner le bit Set-GID tout en effacant la permission d'execution pour le groupe. 
Cette combinaison n'a pas de sens par ailleurs, aussi a-t-elle ete choisie comme marque de 
verrouillage strict. On peut fixer les bits voulus ainsi : 

$ chmod g-x fichier 
$ chmod g+s fichier 

ou a l'ouverture du fichier 

fd = opentfichier, 0_RDWR | 0_CREAT | 0_EXCL, 02644); 



Attention 

Certains systemes de fichiers, par exemple msdos ou vfat, ne permettent pas de fixer les attributs Set-GID 
des fichiers. Les verrous y seront done toujours cooperatifs. 



Lorsqu'un verrouillage est ainsi place sur une portion de fichier, toutes les tentatives de modi- 
fication de son contenu echoueront. Dans l'exemple suivant nous creons un fichier que nous 
verrouillons entierement, puis nous attendons que l'utilisateur appuie sur Entree pour le 
liberer. 

exemple_fcntl_5.c : 

include <fcntl .h> 
#include <stdio.h> 
#include <stdlib.h> 
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//include <unistd.h> 
int 

main (int argc, char * argv[]) 
{ 

char chaine[80]; 
int fd; 
struct flock flock; 
if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s nom_fichier \n", argv[0]); 

exit(EXIT_FAILURE); 

} 

fd = open(argv[l], 0_RDWR | 0_CREAT | 0_EXCL, 02644); 
if (fd < 0) { 

perror( "open" ) ; 

exit(EXIT_FAILURE); 

} 

write(fd, "ABCDEFGHIJ" , 10); 
flock. l_type = F_WRLCK; 
f 1 ock. l_start = 0; 
flock. l_whence = SEEK_SET; 
flock. l_len = 10; 

if (fcntKfd, F_SETLK, & flock) < 0) { 
perror( "fcntl " ) ; 
exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Verrou installe \n"); 
fgets(chaine, 80, stdin); 
close(fd); 

return EXIT_SUCCESS; 

} 

Le blocage strict peut parfois etre dangereux, principalement avec des repertoires exportes en 
NFS, car meme root ne peut plus modifier le contenu d'un fichier verrouille par un utilisateur. 
Aussi, le noyau gere-t-il une validation partition par partition des verrouillages stricts. En 
d'autres termes, il faut que la partition contenant le systeme de fichiers considere ait ete 
montee avec Foption mand, qui autorise les mandatory locks, c'est-a-dire les verrous stricts. 
Cette option n'est generalement pas validee par defaut, aussi root doit-il modifier le fichier 
/etc/f stab pour ajouter l'option ma n d et remonter la partition (ce qui ne necessite pas de rede- 
marrer la machine pour autant). 

$ su 

Password: 

§ ...modification de /etc/fstab. . . 

# cat /etc/fstab 

/dev/hda5 / ext3 defaul ts .rnand 1 1 
[...] 

# mount -o remount / 
§ logout 

$ rm essai .* 

$ ./exemple_fcntl_5 essai. write 

Verrou installe 
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Nous executons alors sur un autre terminal les tentatives d'ecriture suivantes : 
$ Is -1 essai. write 

-rw-r-Sr-- 1 ccb ccb 10 Nov 19 16:12 essai. write 
$ cat exemple_fcntl_5.c > essai .write 

bash: essai. write: Ressource temporai rement non disponible 
$ su 

Password: 

# cat exemple_fcntl_5.c > essai .write 

bash: essai. write: Ressource temporai rement non disponible 

# logout 
$ 

Les appels-systeme write ( ) de l'utilitaire cat echouent avec l'erreur EAGAIN. Notons toutefois 
que le fichier n'est pas pour autant protege contre une suppression par rm, car c'est Fecriture 
dans le repertoire qui est concernee lors d'un effacement et non une ecriture dans le fichier. 
Ceci peut poser des problemes avec les applications qui modifient des fichiers en commen- 
cant par en effectuer une copie (par exemple dans /tmp) avant de supprimer F original et de le 
reecrire. 



Autre methode de verrouillage 

II existe un autre appel-systeme permettant le verrouillage cooperatif de fichiers. Heritee de 
Funivers BSD, la fonction flock( ) n'est pas normalised par SUSv3 et est de moins en moins 
utilisee. Elle permet de verrouiller uniquement un fichier complet par F intermediate d'un 
descripteur. Le prototype est declare dans <sys/f i 1 e . h> : 

int flock (int descripteur, int commande); 

Les commandes possibles sont les suivantes : 

• L0CK_SH : pour placer un verrou partage. Plusieurs processus peuvent disposer simultane- 
ment d'un verrou partage sur le meme fichier. C'est l'equivalent des verrous F_RDLCK de 
f cntl ( ), qui permettent de s' assurer que le fichier ne sera pas modifie pendant qu'on veut 
le lire. 

• L0CK_EX : pour placer un verrou exclusif. II ne peut y avoir qu'un seul verrouillage exclusif 
a la fois. Un processus l'utilise lorsqu'il veut ecrire dans le descripteur. 

• L0CK_UN : pour supprimer un verrouillage precedemment installe. 

On peut egalement ajouter avec un OU binaire la constante L0CK_NB pour empecher la 
demande de verrouillage d'etre bloquante. Si un verrou incompatible est dej a present, F appel- 
systeme flock( ) echouera en renvoyant -1 et en placant EWOULDBLOCK dans errno. Lorsqu'il 
reussit, l'appel f 1 ock( ) renvoie 0. 

Le verrouillage avec f 1 ock( ) n'est pas compatible avec celui qui est fourni par f cntl ( ), et les 
verrous f 1 ock( ) ne sont jamais renforces de maniere stricte par le noyau. De plus, il ne permet 
pas de bloquer uniquement certaines parties d'un fichier. Aussi evitera-t- on au maximum de 
F employer. 
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Conclusion 

Nous avons etudie dans ce chapitre l'essentiel des fonctionnalites concernant la manipulation 
des fichiers, sous forme de descripteurs de bas niveau. 

Nous nous interesserons dans les chapitres a venir aux fichiers en tant qu'entites sur le disque, 
en etudiant les repertoires, les autorisations d'acces, etc. Nous reviendrons sur certaines 
fonctionnalites concernant les descripteurs dans le chapitre sur les communications entre 
processus et dans celui sur la programmation reseau, ainsi que sur tout ce qui a trait aux possi- 
bilites d'entrees-sorties asynchrones. 
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Acces au contenu 
des repertoires 



II est souvent important pour un programme de pouvoir afficher la liste des fichiers contenus 
dans un repertoire. Ceci ne concerne pas uniquement les utilitaires du genre 1 s ou les gestion- 
naires de fichiers, mais peut servir a toute application proposant Fenregistrement et la recupe- 
ration de donnees. 

Les interfaces graphiques actuelles permettent de plus en plus facilement de disposer de boites 
de dialogue pour la sauvegarde ou la lecture de fichiers, sans avoir a ecrire manuellement le 
code de parcours d'un repertoire. Toutefois, dans certaines situations, Faeces au contenu d'un 
repertoire est indispensable, notamment lorsque le nom d'un fichier constitue une information 
importante pour analyser son contenu. Je peux citer le cas d'une application recevant des 
fichiers de donnees meteorologiques, dont le nom permet de retrouver la zone couverte ainsi 
que l'heure de capture. Ces informations pourraient a profit etre integrees dans une section 
d'en-tete du fichier, mais on n'est pas toujours responsable du format des donnees fournies en 
amont d'un systeme, principalement dans un environnement heterogene incluant des dispo- 
sitifs provenant de divers fournisseurs. 

Nous allons done dans ce chapitre nous concentrer sur 1' acces au contenu d'un repertoire, la 
lecture de la liste des fichiers s'y trouvant, la modification du repertoire de travail, la suppres- 
sion de sous-repertoires ou de fichiers, ainsi que la recherche de noms de fichiers par des 
caracteres generiques et le parcours recursif, a la maniere de l'utilitaire find. 

Lecture du contenu d'un repertoire 

Sous Unix, un repertoire est un fichier special, contenant pour chaque fichier ou sous-reper- 
toire une structure opaque variant suivant le type de systeme de fichier. A titre d'exemple, 
avec le systeme ext3, les repertoires comprennent des structures ext3_di r_entry definies dans 
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<1 inux/ext3f s . h>. Chaque structure dispose du nom du fichier, de son numero d'i-nceud, 
ainsi que des champs servant a la gestion interne des structures. 

Au niveau applicatif, les fonctions opendirO, readdirO, closedirO nous permettent 
d'acceder au contenu d'un repertoire sous forme de structures di rent. Pour assurer la portabi- 
lite d'une application, nous nous limiterons a l'utilisation des deux seuls champs qui soient 
definis par SUSv3, char d_name[], qui contient le nom du fichier ou du sous -repertoire et 
ino_t d_ino, le numero d'i-nceud du fichier (ce dernier champ est accessible si la constante 
symbolique _X0PEN_S0URCE contient la valeur 500). 

Ces fonctions sont definies dans <di rent. h> : 

DIR * opendir (const char * repertoire); 
struct dirent * readdir (DIR * dir); 
int cl osedi r(DIR * dir); 

Le type DIR, defini dans <sys/types . h> , est une structure opaque, comparable au flux FILE, 
mais on l'emploie sur des repertoires au lieu des fichiers. A la maniere de f open( ), la fonction 
opendirO renvoie un pointeur NULL en cas d'echec. La fonction readdirO renvoie 1' entree 
suivante ou NULL une fois arrivee a la fin du repertoire. Lorsqu'on a fini d'utiliser le repertoire, 
on le referme avec cl osedi r( ) : 

exemple_opendir.c : 

//include <stdio.h> 
//include <stdlib.h> 
//include <dirent.h> 
//include <sys/types.h> 

void 

affi che_contenu (const char * repertoire) 
{ 

DIR * dir; 
struct dirent * entree; 

dir = opendi r(repertoi re) ; 
if (dir == NULL) 
return ; 

fprintf (stdout, "%s :\n", repertoire); 
while ((entree = readdi r(di r) ) != NULL) 

fprintf (stdout, " %s\n", entree->d_name) ; 
fprintf (stdout, "\n"); 
cl osedi r(di r) ; 

} 

int 

main (int argc, char * argv[]) 
{ 

int i; 

if (argc < 2) 

af f i che_contenu( " . " ) ; 
else for (i =1; i < argc; i ++) 

affi che_contenu(argv[i ] ) ; 
return EXIT_SUCCESS; 

} 
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Ce programme affiche le contenu des repertoires dont le nom est passe en argument. 

$ ./exemple_opendir /etc/Xll/xdm /proc/tty/ 

/etc/Xll/xdm : 

GiveConsole 

TakeConsole 

Xaccess 

Xresources 

Xservers 

Xsession 

Xsetup_0 

chooser 

xdm-config 

authdi r 

Xsetup_0.rpmsave 
/proc/tty/ : 



drivers 
ldiscs 
driver 
ldisc 



Le pointeur renvoye par readdir( ) est une variable statique, qui peut etre ecrasee a chaque 
appel. Cette fonction n'est done pas reentrante et ne doit pas etre utilisee dans un contexte 
multithread. Pour cela, on peut employer la fonction readdi r_r( ) qui prend deux arguments 
supplementaires pour stocker la valeur de retour et memoriser la position suivante dans le 
repertoire. 

I int readdir_r (DIR * dir. 



Cette fonction transmet 0. Arrivee a la fin du repertoire, elle renvoie egalement 0, mais F argu- 
ment memorisation vaut NULL. Voici comment l'utiliser : 

struct dirent resultat; 
struct dirent * memorisation ; 
DIR * dir; 

while (1) { 

if (readdirtdir, & resultat, & memorisation) != 0) 

return -1; 
if (memorisation == NULL) 



$ 



struct dirent * entree, 



struct dirent ** memorisation) 



break; 
fprintf (stdout, 



£s\n", entree->d_name) ; 



fprintf (stdout, "\n"); 
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On peut s'interroger sur Fallocation memoire necessaire pour stocker la chaine de caracteres 
contenant le nom des elements. En fait, cette chaine dispose automatiquement d'une taille 
maximale, definie par la constante NAME_MAX. La structure dirent comprend aussi sur la 
plupart des systemes (mais pas tous) un membre d_naml en contenant la longueur du membre 
d_name comme la valeur renvoyee par strlenO (done caractere nul final non compte). Ce 
champ n'est toutefois pas defini par SUSv3, et on evitera autant que possible de l'employer. 

On observe que readdi r( ) et readdi r_r( ) renvoient les entrees « . » et « . . » correspondant 
respectivement au repertoire courant et a son parent. Ce comportement n'est pas garanti par 
SUSv3. Par contre, ces deux entrees sont toujours valables pour opendirO ou pour des 
commandes de changement de repertoire de travail que nous verrons plus loin. 

Comme avec les flux de fichiers, il est possible de se deplacer au sein des repertoires DIR en 
utilisant rewinddirO, qui revient au debut du repertoire, telldirO, qui renvoie la position 
courante, ou seekdi r( ), qui permet de sauter a une position donnee, renvoyee precedemment 
par tel 1 di r( ). Les prototypes de ces fonctions sont : 

void rewinddir (DIR * dir); 
void seekdir (DIR * dir, off_t offset); 
off_t telldir(DIR * dir); 

Ces trois fonctions sont definies par SUSv3. 

II existe egalement une fonction puissante permettant de selectionner une partie du contenu 
d'un repertoire, de la trier et d'en fournir le contenu dans une table allouee automatiquement. 
Cette fonction est nommee scandi r(), et son prototype peut paraitre un peu inquietant au 
premier coup d'ceil : 

int scandir(const char * dir, struct dirent ***namel ist, 

int (* selection) (const struct dirent * entree), 
int (* comparaison) (const struct dirent ** entree_l, 
const struct dirent ** entree_2)); 

La fonction scandi r( ) commence par lire entierement le contenu du repertoire dont le nom 
lui est fourni en premier argument. Ensuite, elle invoque pour chaque entree du repertoire la 
fonction sel ecti on sur laquelle on lui passe un pointeur en troisieme argument. Si la fonction 
selectionO renvoie une valeur nulle, l'entree considered est rejetee. Sinon, elle est selec- 
tionnee. 

Puis, scandi r( ) trie la table des entrees restantes, en invoquant la routine qsort( ) que nous 
avons etudiee au chapitre 17. Pour pouvoir trier la table, on utilise comme fonction de compa- 
raison celle dont le pointeur est fourni en dernier argument de scandi r( ). 

Une fois la table triee, scandi r( ) met a jour le pointeur passe en second argument pour le 
diriger dessus. Les allocations ayant lieu avec mal 1 oc( ), il faudra liberer ensuite le contenu de 
cette table. 

Si on desire selectionner tout le contenu du repertoire, il est possible de transmettre un poin- 
teur NULL en guise de fonction de selection. La bibliotheque GlibC met egalement a notre 
disposition une fonction alphasortO qui permet de trier automatiquement les entrees du 
repertoire par ordre alphabetique : 

int alphasort (const struct dirent ** entree_l, 
const struct dirent ** entree_2); 
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Nous allons utiliser scandirO et alphasortO pour creer un exemple permettant de selec- 
tionner les elements correspondant a une expression rationnelle dans un repertoire donne. Les 
fonctions regcomp( ) et regexec( ) traitant les expressions rationnelles ont ete presentees dans 
le chapitre 16. 

exemple scandir.c : 

#include <dirent.h> 
#include <regex.h> 
#include <stdio.h> 
#include <stdlib.h> 

regex_t motif_recherche; 

int 

selection(const struct dirent * entree) 
{ 

if (regexec(& motif_recherche, entree -> d_name, 0, NULL, 0) == 0) 

return 1; 
return 0; 

} 

int 

main (int argc, char * argv[]) 
{ 

struct dirent ** liste; 
int nb_entrees; 
int i; 
if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s repertoire motif \n", argv [0]); 

exi t( EXIT_FAI LURE) ; 

} 

if (regcomp(& motif_recherche, argv[2], REG_N0SUB) !=0) { 
fprintf (stderr, "Motif illegal\n"); 
exi t( EXIT_FAI LURE) ; 

} 

nb_entrees = scandi r(argv[l] , & liste, selection, alphasort); 
if (nb_entrees <= 0) 

exit(EXIT_SUCCESS); 
for (i =0; i < nb_entrees; i ++) { 

fprintf (stdout, " %s\n", 1 i ste[i ]->d_name) ; 

freed 1ste[1])i 

} 

fprintf (stdout, "\n"); 

freed iste) ; 

return EXIT_SUCCESS; 

} 

Dans F execution suivante, on remarque deux choses : 

• Les expressions rationnelles ne sont pas identiques aux motifs generiques du shell (princi- 
palement en ce qui concerne le metacaractere *). Nous verrons plus loin dans ce chapitre 
des fonctions permettant d'obtenir le meme comportement. 
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• II ne faut pas oublier de proteger du shell les caracteres speciaux [, ], | ... 

$ . /exemple_scandir /etc/ shad 

shadow 
shadow- 
shadow. bak 

$ ./exemple_scandir /usr/bin/ \[a\|b\]cc 

access 

bcc 

byacc 

pgaccess 

yacc 

$ 

Un repertoire est, nous l'avons dit, considere comme un fichier particulier, mais un fichier 
quand meme. II est done possible d'ouvrir avec open( ) un descripteur sur ce fichier. L'ouver- 
ture ne peut se faire qu'en lecture, car seul le noyau a le droit de modifier le contenu veritable 
du repertoire, pour etre sur de garder 1' ensemble coherent. Le droit d'ecriture sur un reper- 
toire correspond simplement a l'autorisation d'y creer un nouveau fichier - avec open( ) par 
exemple - ou un sous-repertoire, mais en passant toujours par 1' intermediate d'un appel- 
systeme qui permet au noyau de controler les donnees. 

II n'est pas possible de lire directement le contenu d'un descripteur de repertoire avec read( ). 
II faut utiliser des appels-systeme compliques, comme getdents ( ) ou la version bas niveau de 
readdi r( ). Ces appels-systeme peuvent varier d'une version a 1' autre du noyau, et les struc- 
tures de donnees qu'ils manipulent ne sont pas portables. Nous ne les presenterons done pas 
dans cet ouvrage. Le lecteur ayant veritablement besoin d' employer ces fonctions pourra se 
reporter aux sources du noyau ou a celles de la bibliotheque C pour y etudier les details 
d' implementation. 

Changement de repertoire de travail 

Chaque processus dispose en permanence d'un repertoire de travail. Ce repertoire est herite 
du processus pere et peut etre modifie avec l'appel-systeme chdirO. Le changement n'est 
toutefois visible que dans le processus courant et ses futurs descendants, pas dans le 
processus pere. 

Lors de la connexion d'un utilisateur, login lit dans le fichier /etc/password le repertoire 
personnel de l'utilisateur et s'y place, avant d'invoquer le shell. II configure egalement la 
variable d'environnement HOME, qui restera done correctement renseignee, meme si l'utilisa- 
teur se deplace dans 1' arborescence du systeme de fichiers. 

II existe deux appels-systeme permettant de modifier le repertoire courant d'un processus : 
chdi r( ) , qui prend en argument le nom du repertoire destination, et f chdi r( ) , qui utilise un 
descripteur sur le repertoire cible. Ces deux appels-systeme sont declares dans <uni std . h> et 
definis par SUSv3. 

int chdir (const char * nom); 
int fchdir(int descripteur); 

lis renvoient tous deux 0 en cas de reussite, et -1 en cas d'erreur. 
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Nous avons indique qu'un processus dispose toujours d'un repertoire de travail, mais aussi 
surprenant que cela puisse paraitre, il n'existe pas d'appel systeme permettant d'obtenir 
directement le nom de ce repertoire. II faut pour cela s'adresser a une fonction de bibliotheque 
comme getcwdO, getwdO, ou get_current_working_di r_name( ). Cette derniere fonction 
n'est pas definie par SUSv3. Les trois prototypes sont declares dans <uni std . h> : 

char * getcwd (char * buffer, size_t taille); 
char * getwd(char * buffer); 
char * get_current_working_di r_name(void) ; 

La fonction getcwd ( ) copie le chemin du repertoire courant dans le buffer transmis, dont on 
precise egalement la taille. Si le buffer n'est pas suffisamment grand, getcwd ( ) echoue avec 
Ferreur ERANGE. Nous verrons plus bas le moyen de gerer cette situation. Avec la bibliotheque 
GlibC, il est possible de transmettre un buffer NULL, avec une taille valant 0, pour que 
getcwd( ) assure elle-meme l'allocation memoire necessaire. Ce comportement n'est malheu- 
reusement pas portable sur d'autres systemes. 

La fonction get_current_working_di r_name( ) est une extension Gnu (requerant done la defi- 
nition de la constante J3NILS0URCE). Elle alloue automatiquement la taille requise pour le 
stockage du chemin d' acces, en appelant mal 1 oc( ). II faudra done liberer le pointeur obtenu. 

La fonction getwd( ) est un heritage de BSD. II faut done definir la constante _ESSD_SOURCE. 
Cette fonction suppose que le buffer transmis contient au moins PATH_MAX octets. Si ce n'est 
pas le cas, elle risque de declencher silencieusement un debordement. II faut done eviter a 
tout prix d'employer cette routine. 

Le fonctionnement interne traditionnel de getcwd ( ) sous Unix est surprenant. Pour obtenir le 
nom du repertoire courant, getcwd () commence par memoriser le numero d'i-nceud de 
1' entree « . » du repertoire courant. Ensuite, elle analyse toutes les entrees du repertoire « . . » 
pour retrouver celle dont le numero d'i-nceud correspond. Nous verrons au chapitre suivant le 
moyen d'acceder a cette information. Ensuite, le procede est repete en remontant jusqu' a la 
racine du systeme de fichiers. II est alors possible de reconstituer le chemin complet. 

Toutefois, sous Linux, le noyau met a la disposition de la bibliotheque le pseudo-systeme de 
fichiers /proc, qui contient des informations diverses sur le systeme. II existe un sous-reper- 
toire pour chaque processus en cours (par exemple /proc/524/). Dans ce sous-repertoire, on 
trouve divers fichiers, dont un lien symbolique nomme cwd (pour current working directory) 
qui pointe vers le repertoire courant du processus. II suffit alors de lire le contenu de ce lien 
symbolique (que nous etudierons dans le prochain chapitre) pour connaitre le chemin recherche. 
Cette information n'est toutefois disponible que pour le proprietaire du processus concerne. 

Pour simplifier encore le travail, il existe un sous-repertoire /proc nomme self, qui corres- 
pond au processus appelant. Voici done un moyen simple d'acceder au repertoire courant : 

$ cd /etc 

$ Is -1 /proc/self/ 

total 0 



-r--r— r-- 


1 


ccb 


ccb 


0 


Nov 


29 


18 


46 


cmdline 


1 rwx 


1 


ccb 


ccb 


0 


Nov 


29 


18 


46 


cwd -> /etc 


-r 


1 


ccb 


ccb 


0 


Nov 


29 


18 


46 


envi ron 


1 rwx 


1 


ccb 


ccb 


0 


Nov 


29 


18 


46 


exe -> /bin/Is 



[...] 

$ cd /usr/local/sbin/ 
$ Is -1 /proc/self/ 
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total 0 



1 rwx 



-r 



1 rwx 



-r- -r--r— 



1 ccb 

1 ccb 

1 ccb 

1 ccb 



ccb 
ccb 
ccb 
ccb 



0 Nov 29 18:46 cmdline 

0 Nov 29 18:46 cwd -> /usr/1 ocal /sbi n 

0 Nov 29 18:46 environ 

0 Nov 29 18:46 exe -> /bin/Is 



[...] 



$ 



II faut remarquer que lorsque le pseudo-systeme de fichiers /proc n'est pas accessible, la 
bibliotheque C doit se rabattre sur la methode usuelle en remontant de repertoire en repertoire 
jusqu'a la racine. 

Les fonctions de lecture du chemin courant renvoient un pointeur sur le buffer contenant le 
resultat, ou NULL en cas d'echec. Dans ces cas-la, la variable globale errno renferme le type 
d'erreur. Generalement, il s'agit de EINVAL si on a transmis un pointeur illegal, ERANGE si le 
buffer est trop petit, mais on peut aussi rencontrer EACCES. Ce dernier cas est assez rare ; c'est 
une situation oil on se trouve dans un repertoire sur lequel on a le droit d' execution (done de 
parcours) mais pas de lecture, et ou le pseudo-systeme de fichiers /proc n'est pas monte. 
Normalement, ceci ne devrait pas se produire sur les systemes Linux actuels. 

Les applications courantes ont rarement besoin de changer de repertoire de travail. Les boites 
de dialogue graphiques pour le chargement ou la sauvegarde de donnees travaillent en effet 
avec des chemins d'acces absolus (depuis la racine) ou relatifs (depuis le repertoire courant), 
mais ne necessitent pas de changement de repertoire. 

II existe toutefois des processus qui fonctionnent, comme les demons, pendant de longue 
periode, en arriere-plan, en se faisant oublier de l'utilisateur. II faut absolument qu'une telle 
application revienne a la racine du systeme de fichiers lors de son initialisation. En effet, dans 
le cas contraire, il serait impossible de demonter le systeme de fichiers sur lequel elle se 
trouve. Par exemple, un demon lance par un utilisateur depuis son repertoire /home/abc ne 
doit en aucun cas empecher l'administrateur de demonter temporairement la partition / home si 
le besoin se fait sentir. Celui-ci serait oblige d'avoir recours a l'utilitaire f user -k pour tuer le 
processus bloquant le systeme de fichiers. Dans ce type de logiciel, on introduira done un 
chdi r( "/" ) en debut de programme. 

Le programme d'exemple ci-dessous va servir a montrer le comportement de fchdi r( ) , qui 
est legerement plus complique que celui de chdi r( ) puisqu'il faut passer par l'ouverture du 
repertoire avec open( ). Sous Linux, il existe d'ailleurs un attribut 0_DI RECTORY pour open( ), 
servant a faire echouer cet appel systeme s'il est invoque sur autre chose qu'un repertoire. 
Nous n'avons pas employe cet argument car il n'est pas portable, et les developpeurs du 
noyau precisent qu'il ne doit etre utilise que pour F implementation de la fonction de biblio- 
theque opendi r( ). 

Un deuxieme point interessant avec cet exemple est la maniere de traiter l'erreur ERANGE de 
getcwd( ) pour augmenter la taille du buffer fourni. Nous utilisons deliberement une taille ridi- 
culement petite au debut (16 caracteres) pour obliger la routine a reallouer automatiquement 
une nouvelle zone memoire. 

exemplejchdir.c : 

#include <errno.h> 
#1nclude <fcntl .h> 
#1nclude <stdio.h> 
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^include <stdlib.h> 
#include <unistd.h> 
#include <sys/stat.h> 

void 

affiche_chemin_courant (void) 

{ 

char * chemin = NULL; 
char * nouveau = NULL; 
int taille = 16; 

while (1) { 

if ((nouveau = realloc(chemin, taille)) == NULL) { 
perror( "real 1 oc" ) ; 
break; 

} 

chemin = nouveau; 

if (getcwd( chemin, taille) != NULL) { 
fprintf (stdout, "£s\n", chemin); 
break; 

} 

if (errno != E RANGE) { 
perror( "getcwd" ) ; 
break; 

} 

taille *= 2; 

} 

if (chemin != NULL) 
f ree(chemin) ; 



void 

change_chemin_courant (const char * nom) 
{ 

int fd; 

if ((fd = open(nom, 0_RD0NLY) ) < 0) { 
perror(nom) ; 
return; 

} 

if (fchdir(fd) < 0) 

perror(nom) ; 
cl ose(fd) ; 



int 

main (int argc, char * argv[]) 

{ 

int i ; 

affiche_chemin_courant( ) ; 
for (i = 1; i < argc; i++) { 

change_chemin_courant(argv[i ] ) ; 
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aff i che_chemin_courant( ) ; 

} 

return EXIT_SUCCESS; 

} 

Lors de 1' execution, nous allons nous deplacer dans plusieurs repertoires, dont les noms 
mesurent plus de 16 caracteres. 

$ cd /usr/local/bin 

$ ./exemple_fchdir /etc /usr/XHR6/include/Xll/bitmaps/ /etc/inittab 

/usr/local/bin 
/etc 

/usr/XHR6/include/Xll/bitmaps 
/etc/inittab: N'est pas un repertoire 
/usr/XHR6/include/Xll/bitmaps 
$ pwd 

/usr/local/bin 
$ 

La tentative de deplacement vers /etc/i ni ttab (qui est un fichier et pas un repertoire) echoue 
evidemment. Nous voyons aussi que les changements de repertoire courant du processus 
executable n'ont bien entendu pas affecte le repertoire de travail du shell, comme le montre la 
commande pwd invoquee finalement. 

Lorsqu'un programme recoit un nom de fichier (quelle que soit la methode utilisee), il arrive 
qu'il ait besoin de connaitre son emplacement precis sur le systeme. Le chemin transmis peut 
en effet contenir des references relatives au repertoire courant (. ./. ./src/) ou utiliser des 
liens symboliques entre differents repertoires. Pour « nettoyer » un chemin d'acces, il existe 
une fonction realpathO issue de l'univers BSD, mais definie par SUSv3. Suivant les 
systemes Unix et les versions de la bibliotheque C, elle peut etre declaree dans <uni std . h> ou 
dans <stdl i b . h>. Les demieres versions de la GlibC emploient ce dernier fichier d'en-tete. 

char * realpath (char * chemin, char * chemin_exact) ; 

Le premier argument est la chaine contenant le chemin qu'on desire traiter. Le second argu- 
ment est un tableau comprenant au minimum MAXPATHLEN caracteres, cette constante etant 
definie dans <sys/param. h>. Ce tableau sera rempli par la fonction realpath( ), qui renverra 
un pointeur sur lui si elle reussit, ou NULL en cas d'erreur. 

exemple_realpath.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <sys/param. h> 

int 

main (int argc, char * argv[]) 
1 

char chemin_complet[MAXPATHLEN] ; 
int i ; 

for (i =0; i < argc; i ++) { 

fprintf (stderr, "%s : ", argv[i]); 
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if (realpath(argv[i] , chemin_complet) == NULL) 
perrorC'"); 

el se 

fprintf (stderr, "£s\n", chemin_complet) ; 

} 

return EXIT SUCCESS; 



L' execution suivante montre que real path( ) peut aussi bien resoudre les references relatives, 
comme celles qui sont contenues dans le nom du programme executable transmis en argu- 
ment argv[0] de mai n( ), que les liens symboliques comme /usr/tmp qui pointe traditionnelle- 
ment vers /var/tmp. 

$ ./exemple_realpath /usr/tmp/ 

./exemple_realpath : /home/ccb/Doc/ Prog Li nux/Exemples/20/exemple_real path 
/usr/tmp/ : /var/tmp 
$ 

Cette fonction peut etre tres commode dans certains cas, mais elle est toutefois peu conseillee 
car sa portabilite n'est pas assuree du fait qu'elle n'est pas definie par Posix. 



Changement de repertoire racine 

Chaque processus dispose d'un pointeur sur son repertoire racine dans le systeme de fichiers. 
Pour la plupart des processus, il s'agit du veritable repertoire de depart de toute l'arbores- 
cence du systeme. II peut toutefois etre utile dans certaines conditions de modifier le reper- 
toire qu'un processus considere comme la racine du systeme de fichiers. 

Dans [CHESW1CK 1991] An Evening With Berferd, Bill Cheswick decrit un piege qu'il a 
construit pour etudier un pirate. II etablit dans un repertoire banal une fausse arborescence 
avec les sous-repertoires habituels minimaux, et utilise l'appel systeme chrootO pour que 
son visiteur indesirable croit se trouver dans le veritable systeme de fichiers complet. 

L'appel systeme chroot( ) est une fonction privilegiee demandant la capacite CAP_SYS_CHR00T. 
II n'y aurait probablement pas de grand risque a la laisser a la disposition des utilisateurs 
courants, sauf peut-etre pour sa capacite a construire des chevaux de Troie destines a pieger 
les mots de passe d'un autre utilisateur (en ecrivant un faux /bin/su). L' application la plus 
courante de cet appel systeme est celle qui est utilisee dans le demon de ftp anonyme. 
Lorsqu'une connexion est etablie, le processus bascule sur une nouvelle racine du systeme de 
fichiers en /home/ftp. Dans ce repertoire, on retrouve les utilitaires indispensables de /bin et 
les bibliotheques partagees de /lib (respectivement dans /home/ftp/bin et dans /home/ftp/ 
lib). 

Dans l'exemple suivant, nous allons creer un programme Set-UID root qui se deplace dans le 
repertoire indique en premier argument, en fait son repertoire racine, et execute les commandes 
passees dans les arguments suivants. 

exemple_chroot.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
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int 

main (int argc, char * argv[]) 
{ 

if (argc < 3) { 

fprintf (stderr, "Syntaxe %s chemin commande. . .\n" , argv[0]); 
exit(EXIT_FAILURE); 

} 

if (chdir(argv[l]) != 0){ 
perror( "chdi r" ) ; 
exit(EXIT_FAILURE); 

} 

if (chroot(argv[l]) != 0) { 
perror( "enroot" ) ; 
exit(EXIT_FAILURE); 

} 

if (seteuid(getuid( )) < 0) { 
perrort "seteuid" ) ; 
exit(EXIT_FAILURE); 

} 

execvp(argv[2] , argv + 2); 
perrort "execvp" ) ; 
return EXIT_FAII_URE; 

} 

Nous allons demander a ce programme, apres F avoir installe Set-UID root, de lancer la 
commande sh. Pour que cela fonctionne, il faut qu'il puisse trouver ce fichier executable dans 
/bi n et les bibliotheques partagees necessaires dans /lib. Le plus simple est de changer notre 
racine pour aller dans /home/ftp. Nous verifierons alors par un cd / que nous sommes bien 
restes a 1' emplacement prevu. 

$ Is -1 /home/ftp 

total 4 



d--x--x--x 


2 root 


root 


1024 


Aug 


12 


15 


40 


bi n 


d--x--x--x 


2 root 


root 


1024 


Aug 


12 


15 


40 


etc 


drwxr-xr-x 


2 root 


root 


1024 


Aug 


12 


15 


40 


lib 


drwxr-sr-x 


2 root 


ftp 


1024 


Nov 


7 


23 


01 


pub 


$ su 


















Password: 


















§ chown root. root exemple_chroot 














§ chmod u+s 


exemple_chroot 














# exit 


















$ . /exemple_chroot /home/ftp/ sh 














$ cd / 


















$ Is -1 


















total 4 


















d--x--x--x 


2 root 


root 


1024 


Aug 


12 


15 


40 


bi n 


d--x--x--x 


2 root 


root 


1024 


Aug 


12 


15 


40 


etc 


drwxr-xr-x 


2 root 


root 


1024 


Aug 


12 


15 


40 


lib 


drwxr-sr-x 


2 root 


ftp 


1024 


Nov 


7 


23 


01 


pub 



$ exit 
$ 
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Creation et suppression de repertoire 

Pour creer un nouveau repertoire, ou en supprimer un, il existe deux appels systeme, mkdi r( ) 
et rmdirO, dont le fonctionnement est assez intuitif et rappelle les deux commandes /bin/ 
mkdir et /bin/rmdir qui sont construites a partir de ces fonctions. Leurs prototypes sont 
declares ainsi dans <uni std. h> : 

int mkdir (const char * repertoire, mode_t mode); 
int rmdir (const char * repertoire); 

L'emploi du type mode_t pour le second argument de mkdirO necessite Finclusion supple- 
mentaire de <fcntl . h> et de <sys/types . h>, comme avec open( ). 

Ces deux appels systeme renvoient 0 s'ils reussissent, et-1 en cas d'echec. En plus des 
erreurs liees aux autorisations d'acces ou aux irregularites concernant le nom fourni, mkdi r( ) 
peut echouer avec le code ENOSPC dans errno si le disque est sature ou si le quota attribue a 
Futilisateur est rempli, ou avec Ferreur EEXIST si le repertoire existe deja. De son cote, 
rmdi r( ) peut renvoyer surtout les erreurs EACCES ou EPERM liees aux autorisations d'acces, ou 
ENOTEMPTY si le repertoire a supprimer n'est pas vide, ou EBUSY si on essaye de supprimer le 
repertoire de travail courant d'un autre processus. Cette derniere erreur n'est pas respectee sur 
tous les systemes. 

La profondeur des sous-repertoires dans une arborescence n'est pas limitee. II est done 
possible de creer des sous-repertoires imbriques jusqu'a la saturation du disque. II peut toute- 
fois y avoir des limitations liees au systeme de fichiers sous-jacent. Par exemple, les systemes 
ISO 9660, sans les extensions Rock Ridge, ne permettent pas plus de huit niveaux de sous- 
repertoires. Ce systeme de fichiers n'est toutefois utilise que pour les CD-Rom, et il n'y a 
done pas de raisons d'invoquer mkdi r( ) dessus 1 . 

Le mode fourni en second argument de mkdi r( ) sert a indiquer les autorisations d'acces du 
repertoire nouvellement cree. Comme pour open( ), on utilise les constantes S_Ixxx ou leurs 
valeurs octales que nous avons vues dans le chapitre 19. Avec un repertoire, les differents bits 
d'autorisation ont les significations suivantes : 





Bit 


Valeur 


Signification 


s_ 


.ISGID 


02000 


Bit Set-GID : les fichiers ou les sous-repertoires crees dans ce repertoire appartiendront 
automatiquement au meme groupe que lui. 


s_ 


.ISVTX 


01000 


Bit « Sticky » : les fichiers crees dans ce repertoire ne pourront etre ecrases ou effaces que 
par leur proprietaire ou celui du repertoire. C'est utile pour des repertoires comme / tmp ou 
des zones de stockage publiques comme /pub/ incoming d'un serveur ftp anonyme. 


s_ 


_IR... 


0. .4. . 


Lecture : on a acces au contenu du repertoire. 


s_ 


_IW... 


0. .2. . 


Ecriture : on peut creer un fichier ou un sous-repertoire dans le repertoire. 


s_ 


.IX... 


0..1.. 


Execution : on peut entrer dans le repertoire pour en faire son repertoire de travail. 



1. L' application mki sof s est plutot mal nominee, car elle permet uniquement de creer une image d'un repertoire au format 
Iso 9660, mais ne cree pas un systeme de fichiers dans lequel on pourrait ecrire. 
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On trouvera done le plus souvent les valeurs suivantes : 

• 00755 : repertoire normal, lisible, accessible en emplacement pour tous, ecriture unique- 
ment par le proprietaire ; 

• 00700 : repertoire prive, accessible uniquement par son proprietaire (parfois / root) ; 

• 01777 : repertoire /tmp par exemple. 

Bien entendu, le fait d'interdire le parcours ou a plus forte raison la lecture d'un repertoire 
empeche egalement Faeces a tous ses sous-repertoires. 

Lors de la creation d'un nouveau repertoire, les autorisations fournies sont passees au travers 
du umask du processus. Plus precisement, la valeur du umask est extraite des permissions 
demandees. Si le umask vaut 0002 (ce qui est courant) et qu'on demande une creation 00777, 
le repertoire aura en realite la permission 0775. II faut done faire attention a modifier son 
propre umask (nous le detaillerons dans le prochain chapitre) si on essaye de creer des reper- 
toires accessibles a tous. 

L' exemple suivant met en relief ce comportement. Nous essayons a deux reprises de creer un 
repertoire en mode 00777 et nous verifions le resultat en invoquant 1 s. La premiere tentative 
se fait sans modifier le umask, la seconde apres l'avoir ramene a zero. 

exemplejnkdir.c : 

#incl ude <fcntl .h> 
#include <stdio.h> 
//include <stdlib.h> 
//include <unistd.h> 
//include <sys/stat.h> 

int 
main (void) 
{ 

fprintf (stderr, "Creation repertoire mode rwxrwxrwx : "); 
if (mkdi r( "repertoi re" , 0777) != 0) { 

perrort " " ) ; 

exit(EXIT_FAILURE); 
} else { 

fprintf (stderr, "Ok\n"); 

} 

systemC'ls -Id repertoire"); 

fprintf (stderr, "Suppression repertoire : "); 

if ( rmdi r( "repertoi re" ) != 0) { 

perrort " " ) ; 

exit(EXIT_FAILURE); 
} else { 

fprintf (stderr, "Ok\n"); 

} 

fprintf (stderr, "Modification umask\n"); 
umask(O) ; 

fprintf (stderr, "Creation repertoire mode rwxrwxrwx : "); 
if (mkdi r( "repertoi re" , 0777) != 0) { 

perrort " " ) ; 

exit(EXIT_FAILURE); 
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} else { 

fprintf (stderr, "Ok\n"); 

} 

systemC'ls -Id repertoire"); 

fprintf (stderr, "Suppression repertoire : "); 

if ( rmdi r( "repertoi re" ) != 0) { 

perrorC'"); 

exi t( EXIT_FAI LURE) ; 
} else { 

fprintf (stderr, "0k\n"); 

} 

return EXIT_SUCCESS; 

} 

Voici l'execution de ce programme, montrant bien l'influence du umask : 
$ ./exemple_mkdir 

Creation repertoire mode rwxrwxrwx : Ok 

drwxrwxr-x 2 ccb ccb 1024 Nov 30 14:57 repertoire 

Suppression repertoire : Ok 

Modification umask 

Creation repertoire mode rwxrwxrwx : Ok 

drwxrwxrwx 2 ccb ccb 1024 Nov 30 14:57 repertoire 

Suppression repertoire : 0k 

$ 



Suppression ou emplacement de fichiers 

Pour bien comprendre le comportement des fonctions de suppression ou de deplacement de 
fichiers, il est necessaire d' observer la structure des donnees sur un systeme de fichiers Unix. 
Sur le disque, les repertoires sont en realite de simples listes de noms de fichiers, auxquels 
sont associes des numeros d'i-nceuds. Un i-nceud est un identifiant unique pour un fichier sur 
le disque. Par contre, un meme fichier peut avoir plusieurs noms. II existe une table globale 
des i-nceuds, permettant de retrouver le contenu reel du fichier. 

Dans l'exemple suivant, nous allons creer deux fichiers - en copiant des fichiers systeme 
accessibles a tous -, puis utiliser l'utilitaire link pour ajouter plusieurs autres liens physiques 
sur le meme fichier. L' option -i de la version Gnu de Is nous permettra d' observer les 
numeros d'i-nceuds associes aux entrees du repertoire. Nous verifierons done que le meme 
fichier physique dispose de plusieurs noms independants. 

$ cp /etc/services ./un 
$ cp /etc/host. conf ./deux 
$ Is -1 

total 13 

-rw-r--r-- 1 ccb ccb 26 Nov 30 19:04 deux 

-rw-r— r— 1 ccb ccb 11279 Nov 30 19:04 un 

$ In un lien_sur_un 

$ In deux 1 ien_sur_deux 

$ In deux autre_lien_sur_deux 

$ Is -1 

total 27 
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-rw-r--r-- 


3 


ccb 


ccb 


26 


Nov 


30 


19 


04 


-rw-r--r-- 


3 


ccb 


ccb 


26 


Nov 


30 


19 


04 


-rw-r--r-- 


3 


ccb 


ccb 


26 


Nov 


30 


19 


04 


-rw-r--r-- 


2 


ccb 


ccb 


11279 


Nov 


30 


19 


04 


-rw-r--r-- 


2 


ccb 


ccb 


11279 


Nov 


30 


19 


04 


$ Is -1 


















649300 autre_" 


ien_sur_ 


_deux 













649300 1 ien_sur_deux 
649298 un 
649300 deux 
649298 lien_sur_un 
$ rm un 

$ rm 1 ien_sur_deux 
$ Is -1 

total 14 



I ien_sur_deux 
I ien_sur_un 



-rw- 


r- 


-r— 


2 


ccb 


ccb 


26 


Nov 


30 


19 


04 


autre_l ien_sur_deux 


-rw- 


r- 


-r— 


2 


ccb 


ccb 


26 


Nov 


30 


19 


04 


deux 


-rw- 


r- 


-r— 


1 


ccb 


ccb 


11279 


Nov 


30 


19 


04 


lien sur un 



Figure 20.1 

Noms clans un repertoire 
et fichiers physiques 



Repertoire 



Nom fichier 



un 



deux 



lien sur un 



lien sur deux 



autre lien sur deux 



-noeud | 



602213 



649297 



649298 



649300 



649298 



649300 



649300 



(copie de /etc/host. conf) 



Table des i-nceuds 







649298 


• 


649299 




649300 


• 







(copie de /etc/services) 



Dans le i-nceud correspondant a un fichier est memorise le nombre d' entrees de repertoires 
faisant reference a ce fichier, c'est-a-dire le nombre de noms differents dont un fichier 
dispose. Ce nombre est affiche dans la deuxieme colonne de la commande Is -1 . Lorsque le 
nombre de liens tombe a zero, le fichier est effectivement efface du disque s'il n'est ouvert par 
aucun processus, mais il ne Test pas avant. 

L'appel systeme permettant d'effacer un fichier est done nomme unlinkO, et non eraseO, 
del ete( ) ou quelque chose dans ce gout-la, car il sert uniquement a supprimer le lien entre un 
nom de fichier (une entree de repertoire) et l'i-nceud correspondant au contenu du fichier. Cet 
appel est declare dans <unistd.h> ainsi : 



int unl ink(const char * nom_fichier) ; 
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Dans l'exemple suivant, nous allons creer un fichier, puis le supprimer tout en le conservant 
ouvert. Nous controlerons que son nom disparait du repertoire (en invoquant Is -1 ), mais que 
nous pouvons continuer a acceder a son contenu. 

exemple_unlink.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 

int 
main (void) 

{ 

FILE * fp; 

char chaine[27]; 

fprintf (stdout, "Creation fichier\n"); 
fp = fopen( "essai . unl ink" , "w+"); 
if (fp == NULL) { 

perror( "fopen" ) ; 

exi t( EXIT_FAI LURE) ; 

} 

fprintf (fp, "ABCDEFGHIJKLMNOPQRSTUVWXYZ" ) ; 
fflush(fp): 

systemC'ls -1 essai .unl ink" ) ; 

fprintf (stdout, "Effacement fichier\n"); 

if (unl ink( "essai . unl ink" ) < 0) ( 

perrorC'unlink"); 

exi t(EXIT_FAI LURE); 

} 

systemC'ls -1 essai . unl ink" ) ; 

fprintf (stdout, "Relecture du contenu du fichier\n" ) ; 
if (fseektfp, 0, SEEK_SET) < 0) { 

perror( "f seek" ) ; 

exi t(EXIT_FAI LURE); 

} 

if (fgetstchaine, 27, fp) == NULL) { 
perror( "fgets" ) ; 
exi t(EXIT_FAI LURE); 

} 

fprintf (stdout, "Lu : £s\n", chaine); 
fprintf (stdout, "Fermeture fichier\n"); 
fcl ose(fp) ; 
return EXIT_SUCCESS; 



L' execution confirme nos attentes, le fichier a bien disparu du repertoire lors du second appel 
de 1 s, mais on peut continuer a en lire le contenu tant qu'on ne Fa pas referme. 

$ ./exemple_unlink 

Creation fichier 



-rw-rw-r-- 1 ccb 
Effacement fichier 



ccb 



26 Dec 1 14:24 essai .unlink 
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Is: essai .unlink: Aucun fichier ou repertoire de ce type 

Relecture du contenu du fichier 

Lu : ABCDEFGHI JKLMNOPQRSTU VWXYZ 

Fermeture fichier 

$ 

L'appel systeme rmdirO permet de supprimer des repertoires, et l'appel unlinkO des 
fichiers. II existe une fonction de la bibliotheque C nommee remove( ) qui leur sert de frontal 
en invoquant l'appel systeme correspondant au type d'objet concerne. Elle est declaree dans 
<stdi o . h> : 

int remove (const char * nom) 

Son emploi est tres simple, le programme suivant efface les fichiers et repertoires dont les 
noms sont transmis en argument. 

exemple_remove.c : 

#include <stdio.h> 

int 

main (int argc, char * argv[]) 
{ 

char chaine[5]; 
int i; 

for (i =1; i < argc; i ++) { 

fprintf (stderr, "Effacer %s ? ", argv[i]); 
if (fgets(chaine, 5, stdin) == NULL) 
break; 

if ((chaine[0] ! = 'o') && (chaine[0] != '0')) 

continue; 
if (remove(argv[i]) < 0) 

perror(argv[i ] ) ; 

} 

return EXIT_SUCCESS; 

} 

L'exemple d' execution suivant se deroule comme prevu : 

$ touch essai .remove. fichier 
$ mkdir essai . remove. repertoi re 
$ Is -dF essai . remove.* 

essai .remove. fichier essai .remove. repertoire/ 
$ ./exemple_remove essai . remove.* 
Effacer essai .remove. fichier ? o 
Effacer essai . remove. repertoi re ? o 
$ Is -dF essai . remove.* 

Is: essai . remove.*: Aucun fichier ou repertoire de ce type 
$ 

Pour deplacer ou renommer un fichier ou un repertoire, il existe un appel systeme unique, 
rename( ), facile d'utilisation : 

int rename (const char * ancien_nom, const char * nouveau_nom) ; 
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Cette routine renvoie 0 si elle reussit ou-1 en cas d'erreurs, qui, en dehors des problemes 
habituels de pointeurs invalides ou de permissions d' acces, peuvent etre : 

• EBUSY : le repertoire qu'on veut ecraser ou celui qu'on veut deplacer est utilise comme 
repertoire de travail par un processus. 

• EINVAL : on essaye de deplacer un repertoire vers un de ses propres sous-repertoires. C'est 
impossible. 

• EISDI R : on essaye d' ecraser un repertoire existant avec un fichier regulier. 

• ENOTEMPTY : le repertoire qu'on veut ecraser n'est pas vide. 

• EXDEV : on essaye de deplacer un fichier ou un repertoire vers un systeme de fichiers diffe- 
rent. C'est impossible, il faut passer par une etape de copie, puis de suppression. 

Si le fichier ou le repertoire cible existe deja, il est ecrase. Le noyau s'arrange pour que le 
deplacement soit atomique et que le nouveau nom ne soit jamais absent du systeme de 
fichiers. 

Notons que ni rmdi r( ), ni remove( ), ni rename( ) ne sont capables de supprimer ou d'ecraser 
un repertoire non vide. Pour cela, il est necessaire de descendre recursivement jusqu'au 
dernier sous-repertoire, puis de remonter en effacant tout le contenu de chaque sous-reper- 
toire, avec remove ( ) par exemple. C'est ce que fait par exemple la commande rm -r. 



Fichiers temporaires 

II est tres frequent d' avoir besoin de fichiers temporaires. Ne serait-ce que pour inserer des 
donnees au milieu d'un fichier existant, la methode la plus simple consiste a recopier le fichier 
original dans un fichier temporaire en ajoutant au passage les nouvelles informations, puis a 
recopier ou a renommer le fichier temporaire pour ecraser 1' original. 

II existe plusieurs fonctions pouvant nous aider a obtenir un fichier temporaire, mais elles 
doivent etre utilisees avec precaution. En effet, une application ecrite proprement doit eviter a 
tout prix de laisser des fichiers trainer bien apres sa terminaison (dans / trap ou ailleurs). Ce 
n'est pas toujours simple, surtout si le programme peut etre tue abruptement par un signal. 

Le premier point consiste a obtenir un nom de fichier unique. Ce nom doit etre cree par le 
systeme, ce qui nous garantit qu'il ne sera pas reattribue lors d'une autre demande de fichier 
temporaire. II existe principalement trois fonctions pouvant remplir ce role, tempnamO, 
tmpnamO et mktempO, les deux premieres etant declarees dans <stdio.h>, la derniere dans 
<stdlib.h> : 

char * tempnam (const char * repertoi re_temporai re, const char * prefixe); 
char * tmpnam (char * chaine); 
char * mktemp (char * motif); 

Ces trois fonctions renvoient NULL si elles echouent et un pointeur sur la chaine contenant le 
nom temporaire sinon. La premiere fonction, tempnam( ), s'occupe d'allouer l'espace neces- 
saire en utilisant mallocO. Le pointeur renvoye devra done etre libere ulterieurement avec 
freeO. La seconde fonction, tmpnamO, remplit la chaine passee en argument, qui doit 
contenir au moins L_tmpnam octets. Cette valeur est definie dans <stdi o . h>. Si on lui passe un 
pointeur NULL, tmpnamO stockera le nom temporaire dans une zone de memoire statique, 
ecrasee a chaque appel. Comme tout ceci est dangereux dans un contexte multi thread, il 
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existe une fonction tmpnam_r( ), avec la meme interface mais qui n'accepte pas d' argument 
NULL (devenant ainsi a fortiori reentrante). 

Enfin, la fonction mktemp( ) modifie le contenu de la chaine qu'on lui passe en argument. Cette 
derniere doit contenir le motif XXXXXX en guise des six derniers caracteres ; ils seront ecrases 
par une valeur unique lors de l'appel de la fonction. II ne faut done pas passer une chaine 
constante en argument de mktemp( ). 

Les comportements de ces trois fonctions pour obtenir un nom unique sont legerement diffe- 
rents : 

• tempnam( ) utilise les arguments qu'on lui transmet (s'ils ne sont pas nuls) pour composer le 
nom de fichier temporaire. Cette fonction essaye de creer un fichier dans les repertoires 
suivants, successivement : le contenu de la variable d'environnement TMPDIR, le premier 
argument qu'on lui passe, le repertoire correspondant a la constante P_tmpdir de 
<stdi o . h> , et finalement /tmp/. Ensuite, tempnam( ) se sert du prefixe fourni pour composer 
le nom du fichier. 

• tmpnamO donne un nom de fichier temporaire dans le repertoire correspondant a la 
constante P_tmpdi r definie dans <stdio.h> (/tmp/ avec la bibliotheque GlibC). 

• mktemp( ), nous l'avons indique, se borne a remplacer les six derniers X du motif fourni en 
argument pour creer un nom de fichier. 

Voici a present un exemple d'utilisation de ces trois routines, 
exemplejemp.c : 

#include <stdio.h> 
#1nclude <stdlib.h> 

int 
main (void) 
{ 

char * nom_tempnam; 

char nom_tmpnam[L_tmpnam] ; 

char nom_mktemp[20] ; 

nom_tempnam = tempnam(NULL, "abedef"); 
fprintf (stderr, "tempnam(NULL, \"abcdef\") = "); 
if (nom_tempnam == NULL) 
perror( "NULL" ) ; 

el se 

fprintf (stderr, "%s\n", nom_tempnam) ; 
f ree(nom_tempnam) ; 

fprintf (stderr, "tmpnamO = "); 
if (tmpnam(nom_tmpnam) == NULL) 
perror( "NULL" ) ; 

el se 

fprintf (stderr, "£s\n", nom_tmpnam); 

strcpy (nom_mktemp, "/tmp/abcdef XXXXXX" ) ; 
fprintf(stderr, "mktemp(\"/tmp/abcdefXXXXXX\") = "); 
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if (mktemp(nom_mktemp) == NULL) 
perror( "NULL" ) ; 

el se 

fprintf (stderr, "fts\n", nom_mktemp) ; 
return EXIT_SUCCESS; 



On notera que, contrairement a ce qui est affiche durant F execution du programme, on ne 
passe pas la chaine (constante) "/tmp/abcdefXXXXXX" a mktempO, mais un tableau de carac- 
teres qu'elle peut modifier. 

$ ./exemple_temp 

tempnamtNULL, "abcdef") = /tmp/abcdetf hapc 
tmpnamO = /tmp/f i 1 ei 72ule 

mktempC'/tmp/abcdefXXXXXX") = /tmp/abcdefXzqENg 
$ 

Une fois qu'on a obtenu un nom de fichier, encore faut-il Fouvrir effectivement. Cette opera- 
tion s'effectue avec open( ) ou fopen( ) , comme nous l'avons vu dans les chapitres 18 et 19. 
Un probleme peut toutefois se poser. Le systeme nous garantit uniquement que les fonctions 
tempnamO, tmpnamO et mktempO vont renvoyer un nom n'existant pas dans le systeme de 
fichiers. II existe done une condition de concurrence risquee si on considere qu'un autre 
processus peut tres bien creer le fichier entre le moment du retour de la fonction fournissant le 
nom et l'appel de open( ) ou de fopen( ) suivant. Meme si cette situation a tres peu de chances 
de se produire par hasard, elle peut toujours etre exploitee pour creer un trou de securite dans 
un logiciel. 

II est done necessaire de s' assurer que le fichier sera ouvert de maniere exclusive, en 
employant Fattribut 0_EXCL de open( ) ou l'extension Gnu x de fopen( ), ou encore la fonction 
fopen_excl usif ( ) que nous avons ecrite dans le chapitre precedent. On execute done quelque 
chose comme : 

char * nom; 
int fd; 

while (1) { 

nom = tempnam(repertoire_temporaire, prefixe_appl i cation ) ; 
if (nom == NULL) { 

perror( "tempnam" ) ; 

exit(EXIT_ FAILURE); 

} 

fd = opentnom, 0_CREAT | 0_EXCL | 0_RDWR, 0600); 
f ree(nom) ; 
if (fd >= 0) 



/* utilisation du descripteur fd */ 
Toutefois, on peut egalement utiliser la fonction mkstemp( ) , qui est definie dans <stdl i b . h> : 



break 



int mkstemp (char * motif) ; 
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Comme mktempt ), cette fonction modifie le motif fourni, en remplacant les six derniers X par 
une chaine aleatoire. Ensuite, elle ouvre le fichier de maniere exclusive, en mode de lecture et 
ecriture, puis renvoie le descripteur obtenu. Bien entendu, si on desire obtenir un flux et non 
un descripteur, on peut employer la fonction fdopen( ) deja etudiee. 

Quelle que soit la methode choisie, il est important de bien se rappeler qu'on desire obtenir un 
fichier temporaire, ce qui signifie qu'il faut imperativement l'effacer lorsque le programme se 
termine. II est particulierement agacant pour un administrateur systeme de voir le repertoire 
/tmp contenir une myriade de fichiers difficiles a distinguer les uns des autres et qu'il faut 
effacer manuellement de temps a autre (meme si on peut automatiser la suppression en veri- 
fiant la date du dernier acces au fichier a Faide de la commande f i nd). 

Une application soignee doit s'assurer d'effacer tous les fichiers temporaires qu'elle cree. 
Pour cela, la methode la plus simple consiste a demander au systeme d'eliminer le fichier 
aussitot apres son ouverture. On se souvient en effet que l'appel systeme unlinkO ne fait 
disparaitre le contenu d'un fichier qu'une fois qu'il n'est plus ouvert par aucun processus et 
qu'il n'a plus de nom dans le systeme de fichiers. Tant que nous conserverons notre descrip- 
teur ou notre flux ouvert, le fichier temporaire sera done utilisable. Par contre, des sa ferme- 
ture ou la fin du programme, le fichier disparaitra definitivement. Ceci permet de pallier le 
probleme d'une terminaison violente de l'application par un signal. 

Nous utiliserons done un code comme celui-ci : 
int fd; 

char mot1f[20]; 

strcpytmotif , "/tmp/XXXXXX") ; 
fd = mkstemptmotif ) ; 
if (fd < 0) { 

perror( "mkstemp" ) ; 

exit(EXIT_FAILURE); 

} 

unlinktmotif ); 

/* Utilisation de fd */ 

Le fichier sera done elimine automatiquement lors de la fin du programme. II existe une fonc- 
tion tmpfileO, definie par SUSv3, qui realise le meme travail, en renvoyant un flux de 
donnees. Elle est declaree dans <stdio.h> : 

| FILE * tmpfile(void); 

Cette routine gere entierement la creation du nom de fichier, F ouverture exclusive d'un flux et 
la suppression automatique du fichier temporaire. Son seul defaut est que le nom du fichier 
n'est pas accessible. II n'est pas possible de le fournir en argument lors d'une invocation avec 
system( ) d'une autre application (comme sort pour trier le fichier). 

On notera egalement que tmpfile( ) existe sur tous les environnements compatibles Ansi C, 
mais qu'a la difference de SUSv3, un programme se terminant anormalement sur ces 
systemes ne detruira pas necessairement ses fichiers temporaires. 
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Recherche de noms de fichiers 

Correspondance simple d'un nom de fichier 

Lorsqu'on recherche 1' ensemble des fichiers dont les noms correspondent a un motif donne, 
il est possible d'utiliser les routines de manipulation d'expressions regulieres que nous avons 
vues dans le chapitre 16. Toutefois, comme nous l'avons deja fait remarquer, la syntaxe des 
expressions regulieres n'est pas celle qui est communement adoptee par les shells pour iden- 
tifier les fichiers. Pour repondre a ce besoin, la bibliotheque C met a notre disposition la fonction 
fnmatch( ), mieux adaptee a la comparaison des noms de fichiers et definie dans <fnmatch . h> : 

int fnmatch( const char * motif, const char * nom, int attributs); 

Cette fonction compare tout simplement le motif transmis en premier argument avec le nom 
de fichier fourni en seconde position, et renvoie 0 si les chames correspondent, ou FNM_ 
NOMATCH sinon. Sur certains systemes, cette routine peut egalement renvoyer une valeur non 
nulle autre que FNM_NOMATCH en cas d'erreur. Ce n'est pas le cas avec la GlibC. 

Le troisieme argument permet de configurer certaines options par un OU binaire : 





Attribut 


Signification 


FNM_ 


.PATHNAME 


Avec cette option, les caracteres slash V sont traites de maniere particuliere : ils ne sont 
jamais mis en correspondance avec des caracteres generiques. Ce comportement est gene- 
ralement celui desire quand on cherche a mettre en correspondance des noms de fichiers. 


FNM_ 


_FILE_NAME 


II s'agit d'un synonyme de FNM_PATHNAME specifique a Gnu. 


FNM_ 


.PERIOD 


Le caractere point ' . ' est traite specifiquement s'il se trouve en debut de nom. Dans ce cas en 
effet, il ne peut pas etre mis en correspondance avec un motif generique. Ce comportement 
est egalement celui attendu habituellement lors du traitement des noms de fichiers. 


FNM_ 


.NOESCAPE 


Cette option desactive I'utilisation du caractere backslash 'V pour supprimer la signification 
particuliere d'un caractere (comme \* pour indiquer un asterisque). 


FNM_ 


_CASEF0LD 


Cet attribut est une extension Gnu permettant d'ignorer la difference entre les majuscules et 
les minuscules durant la mise en correspondance. 


FNM_ 


_LEADING_DIR 


Cette extension Gnu permet d'autoriser la mise en correspondance si le motif est la partie 
initiale du nom et que le reste de ce nom commence par '/'. Ceci revient a accepter le motif 
/tmp pour /tmp/abcd par exemple. Cette methode n'est toutefois pas la meilleure pour traiter 

des descentes de sous-repertoires. 





Classiquement, sur un systeme Unix, les options qu'on utilise sont FNM_PATHNAME et FNM_ 
PERIOD puisqu'elles permettent de comparer les noms de fichiers de la meme maniere que les 
interpreters de commandes usuels. Dans l'exemple ci-dessous, nous utiliserons la fonction 
scandi r( ) que nous avons deja etudiee, mais cette fois la selection des fichiers a afficher sera 
realisee en employant f nmatch( ) et non plus regexec( ). 

exemplejnmatch.c : 

#include <dirent.h> 

#include <fnmatch.h> 

#include <stdio.h> 

^include <stdlib.h> 

static char * motif = NULL; 
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int 

fn_selection (const struct dirent * entree) 
{ 

if (fnmatch (motif , entree->d_name, FNM_PATHNAME | FNM_PERIOD) == 0) 

return 1; 
return 0; 

} 

int 

main (int argc, char * argv[]) 
{ 

struct dirent ** liste; 
int nb_entrees; 
int i; 

if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s repertoire motif\n", argv[0]); 
exit ( EXIT_FAI LURE ) ; 

} 

motif = argv[2]; 

nb_entrees = scandi r(argv[l] , & liste, fn_selection, alphasort); 
if (nb_entrees <= 0) 

exit(EXIT_SUCCESS); 
for (i =0; i < nb_entrees; i ++) { 

fprintf (stdout, " &s\n", liste[i]->d_name); 

freed iste[i ] ) ; 

} 

fprintf (stdout, "\n"); 

freed iste) ; 

return EXIT_SUCCESS; 

} 

Nous verifions la comparaison sur les points specifiques aux mises en correspondance des 
noms de fichiers : 

$ ./exemple_fnmatch /dev "tty[0-9]*" 

ttyO 

ttyl 

ttylO 

ttyll 

ttyl2 

tty2 

tty3 

tty4 

tty5 

tty6 

tty7 

tty8 

tty9 

$ . /exemple_fnmatch /etc/skel/ ".*" 



Xdefaul ts 
bash_l ogout 
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.bash_profile 

.bashrc 

.kde 

. kderc 

.screenrc 

$ 

Nous voyons bien que le comportement est celui qui est attendu. Bien entendu, les caracteres 
speciaux comme « * » ou « . » doivent etre proteges du shell a l'aide des guillemets pour 
arriver intacts au cceur de notre programme. 

Recherche sur un repertoire total 

L'utilisation conjointe de scandirO et de fnmatchO nous a permis d'extraire une liste de 
noms de fichiers appartenant a un repertoire donne. Pour accomplir cette tache automatique- 
ment, la bibliotheque C met a notre disposition les fonctions globO et globfreeO qui sont 
egalement bien plus puissantes. Elles sont declarees dans <gl ob . h> ainsi : 

int glob(const char * motif, int attribut, 

int (* fn_erreur) (const char * chemin, int erreur), 
gl ob_t * vecteur) ; 

void globfree (glob_t * vecteur); 

La fonction gl ob( ) prend successivement les arguments suivants : 

• le motif qu'on desire mettre en correspondance ; 

• des attributs regroupes par un OU binaire, que nous detaillerons plus bas ; 

• une eventuelle fonction d' erreur qui sera invoquee en cas de probleme ; 

• une structure de type gl ob_t dans laquelle le resultat sera stocke. 

Cette fonction recherche tous les fichiers correspondant au motif transmis, depuis le repertoire 
de travail courant. Bien entendu, si le motif commence par des references relatives ( . . /home/ 
bin/...) ou absolues (/var/tmp/...), le repertoire de recherche est modifie en conse- 
quence. L' ensemble des fichiers selectionnes est stocke dans une table contenue dans la struc- 
ture gl ob_t fournie en dernier argument. Cette structure contient les membres suivants : 





Norn 


Type 1 


Signification 


gl 


_pathc 


i nt 


Ce membre contient le nombre de noms ayant ete mis en correspondance. 


gi. 


_pathv 


char ** 


Ce champ represente un pointeur sur une table de noms de fichiers ayant ete 
selectionnes. 


gi. 


_offs 


i nt 


Ce champ est rempli avant d'appeler gl ob( ). II contient le nombre d'emplacements 
libres que la fonction doit laisser au debut de la table gl _pathv. II n'est utilise que si 
la constante GL0B_D00FS est presente dans les attributs de globO. Sinon, il est 
ignore, meme s'il n'est pas nul. 


gi 


_opendi r 


fonction 


Ce membre est une extension Gnu. II s'agit d'un pointeur sur une fonction permet- 
tant de remplacer opendirO. Le prototype de cette fonction doit etre compatible 
avec celui de opendirO. Ceci est principalement utile pour inserer des routines 
d'encadrement de debogage. 



1 . Les types exacts des pointeurs de fonction ne sont pas developpes. On se reportera au besoin au prototype de la fonction 
remplacee pour implementer une routine ayant la meme interface. 
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Nom 


Type 1 


Signification 


gi 


_cl osedi r 


fonction 


Ce membre est une extension Gnu representant un pointeur sur une fonction 
remplacant cl osedi r( ). 


gi 


_readdi r 


fonction 


Ce membre est une extension Gnu representant un pointeur sur une fonction 
remplacant readdi r( ). 


gi 


_stat 


fonction 


Ce membre est une extension Gnu representant un pointeur sur une fonction 
remplacant stat( ), que nous etudierons dans le prochain chapitre. 


gi 


J stat 


fonction 


Ce membre est une extension Gnu representant un pointeur sur une fonction 
remplacant 1 stat( ), que nous etudierons dans le prochain chapitre. 



1 . Les types exacts des pointeurs de fonction ne sont pas developpes. On se reportera au besoin au prototype de la fonction 
remplacee pour implementer une routine ayant la meme interface. 



II est conseille de se limiter a l'emploi des trois premiers membres uniquement puisqu'ils sont 
definis par SUSv3. 

Les attributs qu'on peut detailler pour parametrer le fonctionnement de globO sont les 
suivants : 





Nom 


Signification 


GL0B_ 


APPEND 


Le resultat doit etre ajoute a celui qui a deja ete obtenu dans la structure glob_t par un 
appel anterieur a globO. Ceci permet de combiner le resultat de plusieurs recherches 
(equivalent ainsi a un OU logique). Cet attribut ne doit pas etre utilise lors de la premiere 
invocation de globO. Le pointeur gl_pathv peut etre modifie par reallocO, et I'ancien 
pointeur n'a peut-etre plus de signification lors du retour de gl ob( ) . II faut done bien relire le 
contenu de ce membre, sans le sauvegarder entre deux appels. 


GL0B_ 


_ALTDIRFUNC 


Cet attribut est une extension Gnu qui indique que globO doit utiliser les pointeurs de 
fonctions des membres gl_opendir, gl_readdir, etc., de la structure glob_t. Ceci n'a 
pas d'utilite dans les applications courantes, mais peut servir a gerer de maniere uniforme 
des repertoires normaux et des pseudo-systemes de fichiers comme une liaison ftp ou le 
contenu d'une archive tar. 


GL0B_ 


.BRACE 


Cette extension Gnu demande que les accolades soient employees a la maniere du shell 
csh, e'est-a-dire qu'elles indiquent une liste des differentes possibilites, separees par des 
virgules. 


GL0B_ 


.DOOFS 


Lorsque cet attribut est signale, la valeur du membre gl_offs de la structure glob_t est 
utilisee pour reserver des emplacements au debut de la table gl_pathv. Les pointeurs ainsi 
reserves sont initialises a NULL. Si on se sert de cet attribut, il faut le mentionner a chaque 
invocation successive eventuelle lors d'un GLOB_APPEND. 

Ceci est utile pour glisser ensuite dans les emplacements libres des chaines representant le 
nom d'un fichier executable a invoquer et ses eventuelles options, avant d'appeler execvp ( ) 
avec le tableau gl_pathv. Ainsi, on peut simuler le developpement des caracteres 
generiques du shell avant de lancer un programme. 


GL0B_ 


.ERR 


Quand gl ob( ) rencontre une difficulty lors de la lecture d'un repertoire, il abandonne imme- 
diatement si cet attribut est present. Sinon, il tente de continuer quand meme. Nous verrons 
plus bas qu'on peut indiquer un pointeur sur un gestionnaire d'erreur dans I'invocation de 
gl ob( ) afin d'affiner la detection de problemes. 


GL0B_ 




.MARK 


Lorsqu'un sous-repertoire correspond au motif transmis, on le stocke en ajoutant un slash a 
la fin de son nom. 
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Nom Signification 



GL0B_ 


.NOCHECK 


Si aucune correspondence n'a pu etre etablie, renvoyer le motif original en guise de resultat 
plutot que d'indiquer un echec. 


GL0B_ 


_N0ESCAPE 


Cette option est equivalente a FNM_NOESCAPE de fnmatchO que globO invoque de 
maniere interne. Elle sert done a desactiver le comportement particulier du backslash 'V, qui 
permet autrement de proteger les caracteres speciaux. 


GL0B_ 


_N0MAGIC 


Cette extension Gnu permet de renvoyer le motif original si aucune correspondance n'est 
trouvee, a la maniere de GL0B_N0CHECK, mais uniquement si le motif ne contient pas de 
caracteres speciaux. Dans ce cas, on peut par exemple decider de creer le fichier, chose qui 
est plus compliquee avec GL0B_N0CHECK seul. 


GL0B_ 


_N0S0RT 


Ne pas trier les chemins d'acces par ordre alphabetique. Ceci permet theoriquement de 
gagner du temps mais, en pratique, le tri en memoire des noms de fichiers consomme avec 
les processeurs modernes une duree infime par rapport a la consultation du contenu du 
repertoire sur le disque. 


GLOB 


PERIOD 


Cette extension Gnu est equivalente a FNM PERIOD defnmatchO. Le caractere point ' . ' en 
debut de nom ne peut pas etre mis en correspondance avec un caractere generique. 


GL0B_ 


.TILDE 


Avec cette extension Gnu, le caractere tilde '-' est traite specialement lorsqu'il apparait en 
tete de motif. Comme avec le shell, le tilde seul ou suivi d'un slash correspond au repertoire 
personnel de I'utilisateur. Si le tilde est suivi d'un nom d'utilisateur, il represente alors son 
repertoire personnel. Par exemple les chaines -/.fvwmrc ou -ftp/pub/ sont traitees 
comme le fait le shell. 

Si le repertoire personnel n'est pas accessible quelle qu'en soit la raison, le tilde est alors 
considere comme un caractere normal appartenant au nom du fichier. 


GL0B_ 


_TILDE_CHECK 


Dans cette extension Gnu, le comportement est le meme que GL0B_TILDE, a la difference 



que gl ob( ) echoue si la mise en correspondance du tilde avec un repertoire personnel n'est 
pas possible plutot que de considerer le tilde comme un caractere normal. 



Si une erreur se produit alors que gl ob( ) tente de lire le contenu d'un repertoire et si le poin- 
teur de fonction fourni en troisieme argument n'est pas NULL, celle-ci sera invoquee avec en 
arguments le nom du chemin d'acces dont la lecture a echoue et le contenu de la variable 
globale errno telle qu'elle a ete remplie par les fonctions opendirO, readdirO, statO ou 
1 stat( ). Si la fonction d' erreur renvoie une valeur non nulle, ou si l'attribut GL0B_ERR a ete 
indique, la fonction glob( ) se terminera immediatement. Sinon, elle tentera de passer a la 
mise en correspondance suivante. 

La valeur de retour de gl ob( ) est nulle si tout s'est bien passe, ou 1 a f oncti on renvoie l'une 
des constantes suivantes en cas d' echec : 

• GLOELABORTED : la routine a ete arretee a la suite d'une erreur. 

• GL0B_NOMATCH : aucune correspondance n'a pu etre etablie. 

• GL0B_N0SPACE : un manque de memoire a empeche l'allocation de l'espace necessaire. 

Finalement, les donnees allouees avec gl ob( ) au sein de la structure gl ob_t peuvent etre libe- 
ries a l'aide de la fonction globfree( ). 

Le programme suivant va simplement afficher les mises en correspondance avec les chaines 
passees en argument. 
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exemple_glob.c : 

#include <stdio.h> 
//include <stdlib.h> 
#include <glob.h> 

int 

main (int argc, char * argv[]) 
{ 

glob_t chemins; 

int i; 

int erreur; 

if (argc < 2) { 

fprintf (stderr, "Syntaxe : %s motif .. .\n", argv[0]); 
exit(EXIT_FAILURE); 

} 

erreur = glob(argv[l], 0, NULL, & chemins); 
if ((erreur != 0) && (erreur != GL0B_N0MATCH) ) 

perror(argv[l]) ; 
for (i = 2; i < argc; i ++) { 

erreur = gl ob(argv[i ] , GL0B_APPEND, NULL, & chemins); 

if ((erreur != 0) && (erreur != GL0B_N0MATCH) ) 
perror(argv[i ] ) ; 

} 

for (i =0; i < chemins . gl_pathc; i ++) 

fprintf (stdout, "£s\n", chemins. gl_pathv[i ] ) ; 
globfree(& chemins) ; 
return EXIT_SUCCESS; 

} 

L' execution confirme le fonctionnement de gl ob( ) dans la verification de repertoires. 

$ ./exemple_glob "/dev/ttyl*" "*lob*" 

/dev/ttyl 

/dev/ttylO 

/dev/ttyll 

/dev/ttyl2 

exempl e_gl ob 

exemple_g1ob.c 

$ 

Developpement complet a la maniere d'un shell 

Le shell offre bien d'autres fonctionnalites que le simple remplacement des caracteres generi- 
ques. La bibliotheque C propose un couple de fonctions, wordexp( ) et wordf ree( ), particulie- 
rement puissantes, qui assurent Fessentiel des taches accomplies habituellement par le shell. 
Ces fonctions travaillent sur un modele assez semblable a celui de gl ob ( ) et de globfree( ), 
mais en utilisant une structure de donnees de type wordexp_t. Elles sont d'ailleurs declarees 
dans <wordexp.h>. Le concept ici est en effet de remplacer des mots par leur signification 
apres les interpretations suivantes : 
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Developpement du tilde 

En debut de chaine, le caractere '-' seul ou suivi d'un slash represente le repertoire personnel 
de l'utilisateur appelant, determine grace a la variable d'environnement HOME. Si le tilde est 
directement suivi d'un nom d'utilisateur, determine avec la fonction getpwnameO que nous 
etudierons dans le chapitre 26, il s'agit du repertoire personnel de celui-ci. Lorsque le tilde 
apparait au cceur d'un nom, il est considere comme un caractere normal. 

Substitution des variables 

Les chaines commencant par un $ sont remplacees par la variable d'environnement corres- 
pondante, avec plusieurs syntaxes possibles : 



Syntaxe 


Substitution 


$VARIABLE 


La valeur de la variable est renvoyee. Le nom de la variable est delimite par le premier 
caractere blanc rencontre apres le $ 


$ { VARIABLE} 


La valeur de la variable est directement renvoyee. Les accolades permettent de 
delimiter le nom, pour pouvoir le joindre a d'autres elements sans inserer d'espace. 
Ainsi, si VAR vaut TERN IT, E${VAR}E correspond a ETERNITE. 


${#VARIABLE) 


Renvoie le nombre de lettres contenues dans la variable. Ainsi, si la variable VAR 
contient le mot ETERNITE, $(#VAR} renvoie 8. 


${ VARIABLE: -DEFAUT} 


Si la variable n'est pas definie ou si elle est vide, renvoyer la valeur par defaut. Sinon 

Icilvuycl la VdlcUl Uc la veUlaUIG- 


${VARIABLE:=DEFAUT} 


Si la variable n'est pas definie ou si elle est vide, la remplir avec la valeur par defaut. 
Renvoyer la valeur de la variable. 


${VARIABLE: 7MESSAGE) 


Si la variable n'est pas definie ou si elle est vide, afficher le message sur stderr et 
echouer. Sinon renvoyer sa valeur. 


${VARIABLE:+VALEUR} 


Renvoyer la valeur indiquee si la variable est definie et non-vide. Sinon ne rien 
substituer. 


${VARIABLE##PREFIXE) 


Renvoyer la valeur de la variable en ayant retire le maximum de caracteres correspon- 
dent au prefixe fourni. 

On essaye de supprimer le plus grand nombre de caracteres possibles. Ainsi si VAR 
vaut ETERNITE, ${VAR##*T} renvoie E, car on supprime tous les caracteres jusqu'au 
second T 


${VARIABLE#PREFIXE} 


Comme pour le cas precedent, on supprime le prefixe indique, mais en retirant le 
minimum de lettres. Si VAR vaut ETERNITE, ${VAR#*T} renvoie ERNITE. 


${VARIABLE%%SUFFIXE} 


Cette fois-ci, on supprime le suffixe indique en essayant de retirer le maximum de 
caracteres. 

$(VARKT*} renvoie uniquement E car on retire tout a partir du premier T. 


${VARIABLE%SUFFIXE} 


Symetriquement, on retire le plus petit suffixe possible. ${VAR%T*} renvoie ETERNI. 



Evaluation arithmetique et execution de commande 

Les chames du type 'commande' ou %{commande) sont remplacees par le resultat de la 
commande qui est executee dans un shell, comme avec la commande system( ). 

Les chaines du type $[ca Icul] ou $( (calcul) ) sont remplacees par le resultat du calcul. On 
trouvera le detail des operations arithmetiques possibles dans la page de manuel du shell. Les 
expressions sont evaluees de gauche a droite. 
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Attention 

La premiere syntaxe $[ca 7 cu 7] est consideree comme obsolete et ne doit dorenavant plus etre employee. 



Decoupage des mots et developpement des noms de fichiers 

Finalement, la chaine est decoupee en mots en employant les separateurs du shell, puis les 
noms de fichiers sont developpes en remplacant tout mot contenant des caracteres generiques 
par la liste des fichiers dont les noms lui correspondent. 

Les fonctions que la bibliotheque C nous fournit pour analyser une chaine a la maniere du 
shell sont les suivantes : 

int wordexp (const char * chaine, wordexp_t * mots, int attributs); 
void wordfree (wordexp_t * mots); 

La fonction wordexp( ) prend la chaine qu'on lui fournit en premier argument, effectue toutes 
les transformations que nous avons apercues ci-dessus, et renvoie la liste des mots trouves 
dans la structure wordexp_t sur laquelle on passe un pointeur en second argument. Cette struc- 
ture contient les membres suivants : 



Nom 


Type 


Signification 


we_wordc 


int 


Le nombre de mots contenus dans le tableau suivant. 


we_wordv 


char ** 


Le tableau proprement dit contenant des pointeurs sur des chaines de 
caracteres correspondant aux differents mots. 


we_off s 


int 


Comme le champ gl_offs de la structure glob_t, ce membre permet de 
reserver de I'espace au debut de la table we_wordv, a condition d'utiliser 
I'attribut WRDE_D00FFS. 



Les differents attributs qu'on peut transmettre a wordexp( ) sont combines avec un OU binaire 
parmi les constantes suivantes : 



Nom 


Role 


WRDE. 


.APPEND 


Ajouter les mots trouves a ceux qui sont deja presents dans la structure wordexp_t. Cette option 
ne doit pas etre utilisee lors du premier appel de wordexp( ). 


WRDE. 


_D00FFS 


Reserver dans la table we_wordv la place indiquee dans le membre we_offs de la structure 
wordexp_t. 


WRDE. 


_N0CMD 


Ne pas effectuer la substitution de commandes. Ceci evite qu'un programme Set-UID execute 
des commandes arbitraires fournies par I'utilisateur. Si on essaye de transmettre une chaine 
contenant 'commande" ou $(commande), wordexp( ) echoue. 


WRDE. 


.REUSE 


Fteutiliser une structure wordexp_t ayant deja servi. Ceci evite de liberer les donnees a chaque 
fois. 


WRDE. 


.SHOWERR 


Lors de la substitution de commandes, sert a utiliser le meme flux d'erreur standard que le 
processus en cours. Ceci permet d'afficher des eventuels messages de diagnostic. Par defaut, 
ces erreurs ne sont pas visibles. 


WRDE. 


.UNDEF 


Considerer qu'il y a une erreur si on essaye de consulter une variable d'environnement non 
definie. 
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La fonction wordexp( ) renvoie zero si elle reussit, ou Fune des constantes suivantes en cas 
d'erreur : 

• WRDE_BADCHAR : la chaine contient un caractere interdit, comme <,>,&, | ou \n. 

• WRDE_BADVAL : une variable est indefinie et on a utilise l'option WRDEJJNDEF. 

• WRDE_CMDSUB : on a essaye de faire une substitution de commandes alors que l'option WRDE_ 
NOCMD a ete demandee. 

• WRDE_NOSPACE : pas assez de memoire pour allouer la table. 

• WRDE_SYNTAX : une erreur de syntaxe a ete detectee, comme des accolades manquantes par 
exemple. 

La fonction wordf ree( ) permet bien sur de liberer la memoire occupee par les tables conte- 
nues dans la structure passee en argument. Dans F exemple suivant, nous allons construire un 
microshell n'ayant qu'une seule commande interne, set , permettant de configurer une variable 
d'environnement. Toutes les autres commandes seront executees en employant execvp( ). 

exemple_wordexp.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <wordexp.h> 

#include <sys/wait.h> 

void 

affiche_erreur (int numero) 
{ 

switch (numero) ( 
case WRDE_BADCHAR : 

fprintf (stderr, "Caractere interdit \n"); break; 
case WRDE_BADVAL : 

fprintf (stderr, "Variable indefinie \n"); break; 
case WRDE_CMDSUB : 

fprintf (stderr, "Invocation de commande interdite \n"); break; 
case WRDE_NOSPACE : 

fprintf (stderr, "Pas assez de memoire \n"); break; 
case WRDE_SYNTAX : 

fprintf (stderr, "Erreur de syntaxe \n"); break; 
default : 
break; 



#define LG_LIGNE 256 

int 
main (void) 

{ 

char 1 igne[LG_LIGNE] ; 
wordexp_t mots; 
int erreur; 
pid_t pid; 
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while (1) { 

/* Lecture de la commande */ 
fprintf (stdout, "-> "); 
if (fgetsdigne, LG_LIGNE, stdin) == NULL) 
break; 

if (strlen(ligne) == 0) 
continue; 

if (ligne[strlen(ligne) - 1] == '\n') 
ligne[strlen(ligne) - 1] = '\0'; 
/* Analyse par wordexpO */ 

if ((erreur = wordexpdigne, & mots. WRDE_SH0WERR) ) != 0) { 
affiche_erreur(erreur) ; 
goto fin_boucle; 

} 

if (mots.we_wordc == 0) 

goto fin_boucle; 
/* Traitement commande interne set */ 
if (strcmp(mots.we_wordv [0], "set") == 0) { 
if (mots.we_wordc != 3) { 

fprintf (stderr, "syntaxe : set variable valeur \n"); 
goto fin_boucle; 

} 

if (setenv(mots.we_wordv[l] , mots .we_wordv[2] , 1) < 0) 

perror( "" ) ; 
goto fin_boucle; 

} 

/* Appel commande externe par un processus fils */ 
if ( (pid = fork ()) < 0) { 

perror( "fork" ) ; 

goto fin_boucle; 

} 

if (pid == 0) { 

execvp(mots.we_wordv[0] , mots .we_wordv) ; 

perror(mots.we_wordv[0] ) ; 

exit(EXIT_FAILURE); 
} else { 

wait(NULL); 

} 

fin_boucle : 

wordf ree(& mots) ; 

} 

fprintf (stdout, "\n"); 
return EXIT_SUCCESS; 

} 

Ce petit programme est simpliste, mais il est deja etonnamment puissant : 

$ ./exemple_wordexp 
-> set VAR ETERNITE 
-> echo ${VAR#*T} 

ERNITE 

-> Is -ftp 

bin etc lib pub 



Acces au contenu des repertoires 

Chapitre 20 



-> set X 1 

-> set Y $(($X + 2)) 
-> echo $Y 

3 

-> echo $(($Y * 25)) 
75 

-> set DATE "date "+%d_%m_%Y"~ 
-> echo $DATE 

05_01_2005 
-> (Controle-D) 
$ 

Bien entendu, nous sommes loin de la realisation d'un veritable shell, capable d' interpreter 
les caracteres speciaux de redirection (< , ou >), les lancements de commandes en arriere-plan 
(&), etc. Malgre tout, nous voyons qu'avec quelques lignes de code il est deja possible 
d'utiliser facilement la puissance des fonctions wordexp( ) et wordf ree( ) de la bibliotheque C. 
Repetons qu'il faut etre tres prudent avec la substitution de commande, qui est un moyen tres 
efficace pour introduire un trou de securite dans un programme Set-UID ou dans un demon. 
On privilegiera done systematiquement Foption WRDE_NOCMD, a moins d' avoir vraiment besoin 
de cette fonctionnalite. 



Descente recursive de repertoires 

Pour 1' instant, nous avons observe le moyen d'acceder au contenu d'un unique repertoire avec 
la fonction scandi r( ). II est parfois necessaire de descendre recursivement une arborescence 
en explorant tous ses sous-repertoires. Ceci peut se realiser a Faide de la commande ftw( ) ou 
de son derive nftwO, declarees toutes deux dans <ftw.h>. Leurs prototypes sont : 

int ftw (const char * depart, 

int (* fonction) (const char * nom, 

const struct stat * etat. 
int attributs), 

int profondeur) ; 

Pour pouvoir utiliser nftwO, il faut definir la constante symbolique _X0PEN_S0URCE et lui 
donner la valeur 500 avant d'inclure <ftw. h>. 

int nftw (const char * depart, 

int (* fonction) (const char * nom. 

const struct stat * etat, 
int attributs, 
struct FTW * status) , 

int profondeur, 
int options); 

Ces deux fonctions partent du repertoire dont le chemin leur est fourni en premier argument. 
Elles parcourent son contenu en invoquant la fonction fournie en second argument pour 
chaque point d' entree du repertoire. Ensuite, elles descendent recursivement dans toute 
F arborescence. Une fois arrivees a la profondeur indiquee en troisieme argument, ces fonc- 
tions devront refermer des descripteurs pour les reemployer a nouveau. Le nombre total de 
descripteurs disponibles simultanement pour un processus est en effet limite. II y a deux dif- 
ferences entre ces deux fonctions : la premiere tient a un argument supplementaire dans la 
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routine invoquee pour chaque entree des repertoires, la seconde reside dans le quatrieme 
argument de nftw( ), qui permet de preciser son comportement. 

Les routines appelees pour chaque entree d'un repertoire recoivent tout d'abord le nom de cet 
element. Leur second argument est une structure stat que nous etudierons en detail dans le 
prochain chapitre, et qui contient diverses informations comme les dernieres dates de modifi- 
cation ou d'acces, le numero d'i-nceud, la taille du fichier, etc. Le troisieme argument est un 
indicateur du type d'entree, qui peut prendre l'une des valeurs suivantes : 



Nom 


Signification 


FTW_D 


L'element est un repertoire. 


FTW_DNR 


L'element est un repertoire dont on ne pourra pas lire le contenu. 


FTW_DP 


L'element est un repertoire dont on a visits tous les sous-repertoires. Ceci n'est defini qu'avec nftw( ), 
lorsque I'option FTW_DEPTH est utilisee. 


FTW_F 


L'element est un fichier. II faut toutefois se metier car ftw( ) considere comme fichier tout ce qui n'est 
pas un repertoire. 


FTW_NS 


L'appel systeme stat( ) a echoue, le second argument de la routine n'est pas valide. Ce cas ne devrait 
normalement jamais se produire. 


FTW_SL 


L'element est un lien symbolique. Comme f tw( ) suit les liens symboliques, ceci ne peut apparaitre que 
si le lien pointe vers une destination inexistante. Parcontre, pour nftwO, cetattribut apparaitsi I'option 
FTW_PHYS est utilisee. 


FTW_SLN 


L'element est un lien symbolique pointant vers une destination inexistante. Cet argument n'apparait 
qu'avec nftw( ). 


La fonction invoquee lors de la descente recursive de nftw( ) recoit done un quatrieme argu- 
ment se presentant sous la forme d'une structure contenant les membres suivants : 


Nom Type Signification 


base int II s'agitde la taille de la partie nom du fichier recu en premier argument. Le reste de lachaine est 
le chemin d'acces au fichier. 


level int II s'agit de la profondeur d'exploration de I'arborescence. La profondeur du repertoire de depart 
vaut 0. 


Les options supplementaires que propose nftw( ) sont les suivantes : 


Nom 


Role 


FTW_CHDIR 


Le processus change son repertoire de travail pour aller dans le repertoire explore, avant d'appeler 
la routine fournie en second argument. 


FTW_DEPTH 


L'exploration se fait en profondeur d'abord, en descendant au plus bas avant de remonter dans les 
repertoires. Les repertoires seront alors detectes apres leurs sous-repertoires (on recevra I'attribut 
FTW_DP et non FTW_D). Cette option permet de vider recursivement une arborescence a la maniere 
de rm -r. 


FTW_M0UNT 


La fonction nf tw( ) se limitera aux repertoires se trouvant sur le meme systeme de fichiers que le 
repertoire de depart. 


FTW_PHYS 


Ne pas suivre les liens symboliques. La routine de I'utilisateur sera invoquee avec I'attribut F_SL. 
Si le lien pointe sur une destination inexistante, I'attribut F_SLN sera alors utilise. 
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Si la fonction appelee pour un element renvoie une valeur non nulle, f tw( ) arrete son explora- 
tion, libere les structures de donnees dynamiques qu'elle utilisait, et renvoie cette valeur. 
Sinon, elle se terminera lorsque tout le parcours sera fini, et renverra 0. 

L'exemple ci-dessous est simplement un effacement recursif d'une arborescence. On prend 
garde a effacer les liens symboliques sans les suivre et a descendre jusqu'au bout des sous- 
repertoires avant de commencer a les vider. 

exemple_nftw.c : 

#define _X0PEN_S0URCE 500 
#include <ftw.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 

int 

routine (const char * nom, const struct stat * etat. 
int attribut, struct FTW * status) 

{ 

if (attribut == FTW_DP) 

return rmdi r(nom) ; 
return unl ink(nom) ; 

} 

int 

main (int argc, char * argv[]) 
{ 

int i; 

for (i = 1; i < argc; i ++) 

if (nftw(argv[i] , routine, 32, 

FTW_DEPTH | FTW_PHYS | FTW_M0UNT) ! = 0) 
perror(argv[i ] ) ; 

return EXIT_SUCCESS; 

} 

Nous allons creer quelques fichiers et sous-repertoires pour pouvoir les supprimer par la 
suite : 

$ mkdir ~/tmp/repl 

$ touch ~/tmp/repl/ficl 

$ touch ~/tmp/repl/fic2 

$ mkdir ~/tmp/repl/repl-l 

$ touch ~/tmp/repl/repl-l/ficl 

$ touch ~/tmp/repl/repl-l/fic2 

$ ./exemple_nftw -/tmp/repl /etc 

/etc : Permission non accordee 

$ cd ~/tmp 

$ Is rep* 

Is: rep*: Aucun fichier ou repertoire de ce type 
$ 
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Conclusion 

Nous avons vu dans ce chapitre l'essentiel des fonctions permettant de travailler au niveau 
d'un repertoire, que ce soit pour en lire le contenu, creer des sous-repertoires, effacer ou 
deplacer des fichiers. 

Les fonctions de mises en correspondance que nous avons etudiees pour rechercher des noms 
de fichiers sont tres performantes, et permettent d'ajouter facilement a une application une 
interface puissante avec le systeme. 

Pour avoir plus de details sur la syntaxe des commandes arithmetiques du shell ou de la subs- 
titution des variables, on pourra se reporter par exemple a [Newham 1995] Le shell Bash. 
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Pour le moment nous avons etudie les fichiers sous Tangle de leur contenu, des moyens d'y 
acceder et d'un point d' entree dans un repertoire. Les fichiers existent pourtant egalement en 
tant qu'entite propre sur le disque, et c'est sous ce point de vue que nous allons les observer 
dans ce chapitre. 

Nous examinerons tout d'abord les differentes informations que le systeme peut nous fournir 
sur un fichier, puis nous nous interesserons successivement a tout ce qui concerne la taille du 
fichier, ses permissions d'acces, ses proprietaire et groupe, ainsi que les divers horodatages 
qui lui sont associes. 

Informations associees a un fichier 

Les informations que nous traitons dans ce chapitre sont independantes du contenu et du nom 
du fichier. Comme nous le verrons plus loin, un meme fichier peut avoir plusieurs noms, dans 
un ou plusieurs repertoires. Pourtant, toutes les representations de ce fichier partagent un 
certain nombre d' informations communes. Ces donnees peuvent etre obtenues avec les 
appels-systeme stat(), fstatO ou IstatO. Tous trois fournissent leurs resultats dans une 
structure stat, definie dans <sys/stat.h>, que nous avons deja rencontree dans le chapitre 
precedent, a propos de ftw( ). Cette structure renfermant en effet toutes les caracteristiques 
principales d'un fichier, on la retrouve tres souvent. 
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La structure stat est definie par SUSv3 comme contenant les membres suivants : 





Norn 


Type 


Signification 




.mode 


mode_t 


Ce champ contient les permissions d'acces au fichier ainsi que le type de ce dernier 
(repertoire, socket, fichier normal...). Les autorisations d'acces peuvent etre modifiees 
avec I'appel-systeme chmod( ). Pour determiner le type du fichier, il existe des macros 
decrites plus bas. 


st_ 


_ino 


ino_t 


La norme SUSv3 parle de numero de reference du fichier. II s'agit d'un identifiant 
unique permettant d'acceder au contenu du fichier. En pratique, sous Linux comme 
avec la majorite des Unix, on le nomme plutot numero d'i-noeud. Ce numero est unique 
au sein d'un meme systeme de fichiers. 


St. 


_dev 


dev_t 


Ce membre comprend le numero du peripherique qui contient le systeme de fichiers 
auquel se rapporte le numero d'i-noeud. Le couple st_ino et st_dev permet de definir 
de maniere unique un fichier. La valeur st_dev n'est pas obligatoirement conservee 
entre deux redemarrages de la machine. Elle peut par exemple dependre de I'ordre de 
detection des disques. On ne doit done pas considerer qu'elle a une duree de vie plus 
longue que celle de I'execution d'un processus. 


St. 


_n 1 i n k 


nl ink_t 


Un fichier pouvant avoir plusieurs noms, ce champ en conserve le nombre. II s'agit 
done du nombre de liens physiques sur I'i-noeud. Lors d'un appel-systeme unl ink( ), 
cette valeur est decrementee. Le fichier n'est veritablement supprime que lorsque st_ 
n 1 ink arrive a zero. 


St. 


_uid 


uid_t 


Ce champ contient I'UID du proprietaire du fichier. II n'y a qu'un seul proprietaire pour 
un fichier, meme si celui-ci dispose de plusieurs noms. Ce champ peut etre modifie par 
I'appel-systeme chown( ). 


St. 


_gid 


gid_t 


Comme st_uid, ce membre identifie I'appartenance du fichier, mais cette fois-ci a un 
groupe. La valeur est modifiee egalement par I'appel-systeme chown( ). 


St. 


.size 


off_t 


La taille du fichier est ici mesuree en octets. Elle n'a de veritable signification que pour 
les fichiers normaux, pas pour les liens symboliques ni pour les fichiers speciaux de 
peripherique. 


St. 


.atime 


time_t 


Ce membre contient la date du dernier acces au fichier. Elle est mise a jour lors de 
toute lecture ou ecriture du contenu du fichier. 


St. 


.ctime 


time_t 


La date de changement du status du fichier est mise a jour a chaque consultation ou 
modification du contenu du fichier, mais egalement lors de la modification de ses 
caracteristiques (avec chmodt ), chown( )...). 


St. 


.mtime 


time_t 


Cette date est celle de la derniere modification du contenu du fichier. Elle n'est pas 
affectee par les changements de proprietaire, de permissions... 


St. 


_rdev 


dev_t 


Pour un fichier special representant un peripherique, il s'agit des numeros d'identifica- 
tion majeur et mineur. Le numero majeur est contenu dans le poids fort, le mineur dans 
le poids faible. 


St. 


_bl ksize 


long 


II s'agit de la taille de bloc la mieux adaptee pour les entrees-sorties sur ce fichier. Elle 
est mesuree en octets. Cette valeur est tres utile, nous I'avons vu au chapitre 18, 
lorsqu'on desire configurer la taille d'un buffer de sortie avec setvbufO. Nous 
sommes assure en utilisant un buffer dont la taille est un multiple de st_bl ksize 
d'avoir des entrees-sorties par flux optimales pour ce systeme de fichiers. 


St. 


_bl ocks 


long 


Cette valeur represente la taille effectivement allouee pour le fichier, telle qu'elle est 
mesuree par I'utilitaire du. Ce champ est evalue en nombre de blocs, mais la taille 
meme des blocs n'est pas disponible de maniere portable. On evitera d'utiliser ce 
membre. 
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Les prototypes des fonctions de la famille stat( ) sont declares dans <unistd.h>. 

int stat (const char * nom_fichier, struct stat * infos); 

int fstat (int descripteur, struct stat * infos); 

int lstat (const char * nom_fichier, struct stat * infos); 

La fonction stat( ) prend en premier argument un nom de fichier et remplit la structure stat 
sur laquelle on lui a transmis un pointeur en seconde position. Pour acceder aux informations 
concernant un fichier, il faut simplement avoir un droit de parcours (execution) dans le reper- 
toire le contenant, ainsi que dans les repertoires parents. 

L'appel-systeme 1 stat( ) fonctionne comme stat( ), mais lorsque le nom correspond a un lien 
symbolique, il fournit les informations concernant le lien lui-meme et pas celles correspon- 
dant au fichier vise par le lien. 

Enfin, f stat( ) utilise un descripteur de fichier deja ouvert, ce qui peut permettre par exemple 
de verifier le type de descripteur associe aux flux d' entree ou de sortie standard (STDI N_ 
FILENO, STD0UT_FI LENO). 

Pour verifier le type d'un fichier, il faut utiliser une macro qui prend en argument le champ 
st_mode de la structure stat. Ces macros sont definies par Posix et prennent une valeur vraie 
si le fichier correspond au type indique. 



Macro Signification 



s_ 


.ISBLK (infos 


-> st_mode) 


Fichier special de peripherique en mode bloc 




s_ 


.ISCHR (infos 


-> st_mode) 


Fichier special de peripherique en mode caractere 




s_ 


.ISDIR (infos 


-> st_mode) 


Repertoire 




s_ 


.ISFIFO (infos 


-> st_mode) 


FIFO (tube nomme) 




s_ 


.ISLNK (infos 


-> st_mode) 


Lien symbolique 




s_ 


.ISREG (infos 


-> st_mode) 


Fichier regulier 




s_ 


.ISSOCK (infos 


-> st_mode) 


Socket 





Pour connaitre les autorisations d'acces du fichier, on prend des constantes symboliques 
qu'on compare en utilisant un ET binaire au champ st_mode de la structure stat. Ces 
constantes ont ete presentees dans le chapitre 19, lors de la description du troisieme argument 
de open( ). II s'agit des valeurs S_I RUSR, S_I XGRP, etc. On peut eventuellement se permettre, au 
risque d'une portabilite legerement amoindrie, de consulter directement la valeur st_mode, en 
effectuant un ET binaire avec le masque octal 07777, comme nous l'avions signale a propos 
de open( ). 

Rappelons qu'un fichier ne possedant pas l'autorisation d'execution pour son groupe S_I XGRP, 
mais ayant par contre Fattribut Set-GID I_SGID, est en realite un fichier sur lequel un 
verrouillage strict s'applique, comme nous en avons vu des exemples a la fin du chapitre 19. 

Le programme suivant permet de connaitre le type et les autorisations d'acces a un fichier. Si 
on lui transmet un ou plusieurs noms en arguments, il utilise stat( ) pour obtenir les informa- 
tions. Si on ne lui envoie rien, il invoque fstat ( ) pour afficher les donnees correspondant a 
ses flux d' entree et de sortie standard. 
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exemple_stat.c : 

#include <stdio.h> 

//include <stdlib.h> 

//include <unistd.h> 

//include <sys/stat.h> 

void 

aff i che_status (struct stat * status) 
{ 

if (S_ISBLK(status->st_mode)) 

fprintf (stderr, "bloc "); 
else if (S_ISCHR(status->st_mode)) 

fprintf (stderr, "caractere "); 
else if (S_ISDIR(status->st_mode)) 

fprintf (stderr, "repertoire "); 
else if (S_ISFIFO(status->st_mode) ) 

fprintf (stderr, "fifo "); 
else if (S_ISLNK(status->st_mode)) 

fprintf (stderr, "lien "); 
else if (S_ISREG(status->st_mode)) 

fprintf (stderr, "fichier "); 
else if (S_ISSOCK(status->st_mode)) 

fprintf (stderr, "socket "); 



fprintf (stderr. 


"u:"); 














fprintf (stderr, 


status 


->st 


_mode ! 


< s_ 


.IRUSR ? 






fprintf (stderr, 


status 


->st 


_mode ! 


< s_ 


.IWUSR ? 


"w" 




fprintf (stderr. 


status 


->st_ 


_mode ! 


« s_ 


.IXUSR ? 


"x" 




fprintf (stderr, 


" g:") 














fprintf (stderr, 


status 


->st 


_mode ! 


< s_ 


.IRGRP ? 


« r » 




fprintf (stderr, 


status 


->st 


jnode ! 


« s_ 


.IWGRP ? 


"w" 




fprintf (stderr, 


status 


->st 


_mode ! 


« s_ 


.IXGRP ? 


"x" 




fprintf (stderr, 


" o:") 














fprintf (stderr, 


status 


->st 


_mode ! 


« s. 


.IROTH ? 


»p" 




fprintf (stderr. 


status 


->st_ 


jnode ! 


« s_ 


.IWOTH ? 


"w" 




fprintf (stderr, 


status 


->st 


_mode ! 


< s_ 


.IXOTH ? 


"x" 




fprintf (stderr, 


"\n"); 















if (argc == 1) { 

fprintf (stderr, "stdin : "); 
if ( f stat ( STDIIM_FI LENO , & status) < 0) 
perror( " " ) ; 

el se 

aff i che_status(& status); 
fprintf (stderr, "stdout : "); 




int 

main (int argc, char * argv[]) 



struct stat status; 
int i ; 
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if (fstat(STDOUT_FILENO, & status) < 0) 
perrorC'"); 

el se 

affiche_status(& status); 

} else { 

for (1=1; t < argc ; i ++) { 

fprintf (stderr, "%s : ", argv[i]); 
if (stat(argv[i] , & status) < 0) 
perrort " " ) ; 

else 

affiche_status(& status); 

} 

} 

return EXIT_SUCCESS; 

} 

Lors de l'execution de ce programme, nous essayons d'examiner les principaux types de 
fichiers, peripheriques de type bloc ou caractere, repertoires, fichiers normaux et FIFO obtenus 
grace a une redirection du shell. 

$ . /exemple_stat /dev/hdal /dev/ttyS2 /etc/passwd 

/dev/hdal : bloc u:rw- g:rw- o: — 

/dev/ttyS2 : caractere u:rw- g: — o: — 

/etc/passwd : fichier u:rw- g:r-- o:r-- 

$ . /exemple_stat /etc 

/etc : repertoire u:rwx g:r-x o:r-x 

$ ./exemple_stat | cat 

stdin : caractere u:rw- g:-w- o: — 

Stdout : fifo u:rw- g: 0: 

$ cat /dev/null | ./exemple_stat 
stdin : fifo u:rw- g: — o: — 
stdout : caractere u:rw- g:-w- o: — 
$ 



Autorisation d'acces 

Pour modifier les autorisations d'acces a un fichier, on utilise l'un des appels-systeme chmod( ) 
ou fchmod( ) declares dans <sys/stat. h> : 

int chmod (const char * nom_fichier, mode_t mode); 
int fchmod (int descripteur, mode_t mode); 

On voit que fchmod () agit directement sur un descripteur de fichier deja ouvert alors que 
chmod ( ) travaille sur un nom de fichier. Pour etre autorise a changer les autorisations associees 
a un fichier, il faut que l'UID effectif du processus appelant soit egal a 0 (root) ou a celui du 
proprietaire du fichier (indique dans le champ st_ui d de la structure stat). Si toutefois le GID 
du fichier (champ st_gid) n'est egal a aucun des groupes auxquels appartient le processus 
appelant, et si l'UID effectif de ce dernier n'est pas nul, le bit S_ISGID (Set-GID) sera silen- 
cieusement efface. 

Lorsqu'un processus accede veritablement a un fichier grace aux appels-systeme open( ) ou 
execve( ), l'UID pris en compte pour verifier les autorisations est l'UID effectif du processus 
et pas son UID reel. Cela pose un probleme pour les processus Set-UID. Supposons que nous 



572 



Programmation systeme en C sous Linux 



ecrivons un programme pilotant une interface specifique personnalisee (automate industriel, 
instrument de mesure scientifique...). Cette application, pour dialoguer avec notre dispositif, 
doit employer des appels-systeme privilegies. Pour avoir le droit d'exploiter ces appels et 
pour pouvoir etre employee par n'importe quel utilisateur, l'application doit etre installee 
Set-UID root. Notre processus dispose done de la toute -puissance de root. Toutefois, nous 
desirons egalement que l'utilisateur puisse sauvegarder des donnees dans ses propres fichiers. 
On ne peut pas utiliser directement l'appel open ( ) car, l'UID effectif etant celui de root, notre 
utilisateur pourrait ecraser n'importe quel fichier. II est possible d'abandonner temporaire- 
ment nos privileges, comme nous l'avons etudie dans le chapitre 2, mais e'est fastidieux si on 
alteme regulierement des entrees-sorties avec i nb( )-outb( ) et des ouvertures de fichiers. 

Le meme probleme se pose avec des applications comme l'utilitaire de communication 
mi ni com, qui doit etre Set-UID (ou au moins Set-GID) pour avoir le droit d'acceder au peri- 
pherique de liaison serie, et qui permet a l'utilisateur d'enregistrer sa configuration ou 
l'ensemble de sa session dans un fichier. 

II existe done un appel-systeme nomme access ( ) qui permet de verifier si un processus peut 
executer ou non un acces particulier a un fichier en se fondant sur son UID reel (celui de 
l'utilisateur qui a lance le processus). II est declare dans <uni std . h> : 

int access (const char * nom_fichier, int mode); 

Le mode qu'on transmet en second argument correspond a l'utilisation qu'on desire faire du 
fichier. II existe quatre constantes symboliques : 
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F_0K 


Le fichier existe-t-il ? 




R_0K 


Puis-je lire le contenu du fichier ? 




W_0K 


Puis-je ecrire dans le fichier ? 




X_0K 


Puis-je executer le fichier ? 





Attention 

La verification n'a lieu qu'en ce qui concerne les bits d'autorisation du fichier, le test d'execution peut tres bien 
reussir alors que execve( ) echouera si le fichier n'est pas dans un format executable correct. 



La valeur renvoyee par cet appel-systeme est nulle si Faeces est autorise, et vaut -1 sinon. La 
variable globale errno est dans ce cas remplie. 

On emploie done access( ) immediatement avant l'appel open( ) ou execve( ) correspondant. 
II faut etre conscient du risque potentiel concernant la securite, car il existe un petit delai entre 
la verification des autorisations avec l'UID reel et l'ouverture du fichier avec l'UID effectif. 
Un utilisateur malintentionne pourrait profiter de ce delai pour supprimer le fichier banal qu'il 
proposait de modifier et le remplacer par un lien materiel vers un fichier systeme (/etc/ 
passwd par exemple) que l'UID effectif du processus pourra ouvrir. Pour eviter ce genre de 
desagrement, on preferera autant que possible perdre temporairement nos privileges pour 
retrouver l'identite effective de l'utilisateur ayant lance le programme, en employant les 
appels-systeme setreuidO ou setresuidO. 
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Proprietaire et groupe d un fichier 

Lorsqu'un processus Set-UID verifie avec access ( ) s'il peut ecrire ou creer un fichier et qu'il 
le cree effectivement, avec openO ou creatO, ce nouveau fichier possede les UID et GID 
effectifs du processus appelant. II lui faut done modifier les appartenances du nouveau fichier 
pour les faire correspondre a celles de l'utilisateur. 

Seul un processus ayant un UID effectif nul ou la capacite CAP_CH0WN peut modifier le proprie- 
taire d'un fichier. Par contre, le proprietaire d'un fichier peut l'affecter a n'importe quel groupe 
auquel il appartient lui-meme. Les identites du proprietaire et du groupe sont communes a 
toutes les occurrences du fichier a travers ses differents noms (via des liens physiques). 

Pour modifier FUID ou le GID d'un fichier, on emploie les appels-systeme chown( ), fchown( ) 
et 1 chown( ) , declares dans <uni std . h> : 

int chown (const char * nom_fichier, uid_t proprietaire, gid_t groupe); 
int fchown (int descripteur_fichier, uid_t proprietaire, gid_t groupe); 
int lchown (const char * nom_fichier, uid_t proprietaire, gid_t groupe); 

Les appels-systeme chown () et 1 chown () modifient F appartenance d'un fichier dont le nom 
leur est fourni en premier argument. La difference concerne les liens symboliques ; chown ( ) 
modifie F appartenance du fichier vise par le lien alors que 1 chown ( ) s'applique au lien lui- 
meme - ce qui ne presente pas beaucoup d'interet. De son cote, fchown ( ) agit sur le descrip- 
teur d'un fichier deja ouvert. Si Fun des UID ou GID indiques vaut -1, cette valeur n'est pas 
changee. 

Lors de la modification du proprietaire, le bit Set-UID eventuel est efface. Lors de la modifi- 
cation du groupe, le bit Set-GID est efface si ce fichier possede egalement le bit d' execution 
pour son groupe (sinon e'est un fichier avec un verrouillage strict). 

On reprend l'exemple d'un logiciel de communication comme mini com et d'une sequence 
access( ) suivie de open( ) comme nous Favons decrit ci-dessus pour creer un fichier d'enre- 
gistrement. La modification du proprietaire de ce fichier necessiterait en theorie que F applica- 
tion soit Set-UID root. Toutefois, il existe d'autres possibilites, notamment on peut utiliser un 
executable Set-GID appartenant a un groupe autorise a acceder aux ports de communication 
(uucp par exemple). La modification de F appartenance du nouveau fichier est alors restreinte 
a celle de son groupe, ce qui peut etre envisage avec n'importe quel UID effectif. II vaut 
mieux, pour des raisons de securite, employer dans ce cas f chown () directement sur le 
descripteur du fichier qu'on vient de creer plutot que chown ( ) sur son nom, car l'utilisateur 
pourrait a nouveau exploiter le delai entre la creation du fichier et la modification de son 
appartenance pour l'effacer et le remplacer par un lien materiel sur un fichier systeme. 

Taille du fichier 

La taille d'un fichier est indiquee par le champ st_size de la structure stat. Nous reprenons 
le programme exempl e_stat . c et nous le modifions pour obtenir exempl e_tai 1 1 es . c : 

• On remplace Faffichage des modes status->st_mode par Faffichage de la taille status- 
>st_si ze. 

• On remplace l'appel statO par IstatO pour ne pas suivre les liens symboliques mais 
s'interesser au lien lui-meme. 
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Le programme ainsi obtenu nous permet de formuler plusieurs observations : 

$ . /exemple_tailles /dev/hda /dev/ttySO 

/dev/hda : bloc 0 
/dev/ttySO : caractere 0 
$ 

Les fichiers speciaux (en mode caractere ou bloc) ont une taille nulle. En realite, il s'agit 
simplement d'indicateurs pour le noyau. lis occupent une entree de repertoire, mais pas 
d' autre place sur le disque. Nous reviendrons sur ces fichiers plus loin. 

$ . /exemple_tailles /etc /usr /dev 

/etc : repertoire 8192 
/usr : repertoire 4096 
/dev : repertoire 118784 
$ mkdir vide 

$ . /exemple_tailles vide 

vide : repertoire 4096 
$ rmdir vide 
$ 

Un repertoire occupe une taille (multiple de 4 096 sur ce systeme de fichiers) correspondant a 
son contenu, c'est-a-dire les noms des fichiers et les pointeurs vers les i-nceuds. 

$ Is -1 /etc/services 

-rw-r-r-- 1 root root 11279 Nov 10 11:34 /etc/services 
$ In -sf /etc/services . 
$ ./exemple_tailles /etc/services services 
/etc/services : fichier 11279 
services : lien 13 
$ rm services 
$ 

Un fichier normal occupe la taille necessaire pour stocker son contenu. Un lien symbolique 
n'emploie que la taille indispensable pour enregistrer le nom du fichier vers lequel il pointe 
(en l'occurrence « /etc/services » comporte 13 caracteres). 

$ cat /dev/null | ./exemple_tailles | cat 

stdin : fifo 0 
stdout : fifo 0 
$ 

Les tubes et les FIFO sont des structures particulieres n'ayant pas de taille attribuee (bien 
qu'elles aient toutefois une dimension maximale). 

Remarquons bien que les donnees fournies par le membre st_size de stat correspond a la 
taille des donnees contenues dans un fichier, et pas forcement a son occupation sur le disque. 
En voici un exemple : 

$ ./exemple_tailles /etc/services 

/etc/services : fichier 11279 
$ du -b /etc/services 

12288 /etc/services 
$ 
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L'utilitaire du calcule en effet la place occupee en prenant en compte la taille des blocs du 
sy steme de fichiers et le nombre de blocs employes. 

Lorsqu'on desire augmenter la dimension d'un fichier, on utilise simplement les fonctions 
d'ecriture. Pour diminuer sa taille, le travail est plus complique : il faut proceder en realisant 
une copie partielle du fichier original, qu'on renommera ensuite. Une autre possibilite 
consiste a utiliser des fonctions truncate( ) ou ftruncate( ) , declarees dans <uni std.h> : 

int truncate (const char * nom_fichier, off_t longueur); 
int ftruncate (int descripteur_fichier, off_t longueur); 

Dans le cas d'une reduction de taille, les donnees supplementaires se trouvant en fin de fichier 
sont simplement eliminees. Si la longueur demandee est plus grande que la taille actuelle du 
fichier, la zone intermediate est remplie de zeros. Comme nous l'avions deja observe dans le 
chapitre 19, ces zeros sont autant que possible des trous dans le fichier. 

exemplejruncate.c : 

#include <stdio.h> 
finclude <stdlib.h> 
#include <unistd.h> 

int 

main (int argc, char * argv[]) 

{ 

long longueur; 

if ((argc != 3) || (sscanf (argv[2] , "%ld", & longueur) != 1 ) ) { 
fprintf (stderr, "Syntaxe : %s fichier longueur \n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

if (truncate(argv[l] , longueur) < 0) 

perror(argv[l] ) ; 
return EXIT_SUCCESS; 

} 

Nous utilisons le programme exempl e_getchar du chapitre 10 pour examiner le contenu d'un 
fichier que nous fabriquons et dont nous modifions la taille. 

$ echo -n "abcdefghi jklmnopqrstuvwxyz" > essai .truncate 
$ Is -1 essai .truncate 

-rw-rw-r-- 1 ccb ccb 26 Dec 30 23:34 essai .truncate 

$ . /exempl e_truncate essai .truncate 10 
$ Is -1 essai .truncate 

-rw-rw-r-- 1 ccb ccb 10 Dec 30 23:34 essai .truncate 

$ . ./10/exemple_getchar < essai .truncate 

00000000 61 62 63 64 65 66 67 68-69 6A abcdefghi 
$ . /exempl e_truncate essai .truncate 20 
$ Is -1 essai .truncate 

-rw-rw-r-- 1 ccb ccb 20 Dec 30 23:34 essai .truncate 

$ . ./10/exemple_getchar < essai .truncate 

00000000 61 62 63 64 65 66 67 68-69 6A 00 00 00 00 00 00 abcdefghij 
00000010 00 00 00 00 
$ rm essai .truncate 
$ 
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f truncate ( ) peut etre tres utile pour fixer precisement la longueur d'un fichier qu'on desire 
projeter en memoire. Cela s' applique principalement aux applications qui veulent projeter 
simultanement plusieurs zones du meme fichier, en ajoutant ainsi des blocs complets en fin de 
fichier. 

Horodatages d'un fichier 

Nous avons observe dans la structure stat que trois dates sont associees a un fichier : 

• st_atime, la date du dernier acces au contenu du fichier, en lecture ou en ecriture. 

• st_mti me , la date de derniere modification du contenu du fichier avec une primitive d' ecri- 
ture. 

• st_ctime. la date de derniere modification de la structure stat associee au fichier, ce qui 
inclut le changement de proprietaire, de mode. . . 

Le type utilise pour enregistrer ces dates est time_t, qui s'exprime en secondes ecoulees 
depuis le l el janvier 1970. Nous reviendrons sur ces types de donnees dans le chapitre 25. 

Les horodatages sont mis a jour automatiquement par le noyau, mais on peut avoir besoin 
pour de nombreuses raisons de modifier les dates st_atime ou stjtime. Le champ st_ctime 
ne peut etre mis a jour que par le noyau. Les appels utimeO et utimesO sont declares res- 
pectivement dans <utime.h> et <sys/time.h>. lis servent tous deux a mettre a jour les dates 
st_atime et stjntime, mais utimes( ) permet d'acceder a une precision de l'ordre de la micro- 
seconde, alors que utime( ) est limite a la seconde pres par le type time_t. 

int utime (const char * nom_fichier, struct utimbuf * dates); 
int utimes (const char * nom_fichier, struct timeval dates [2]); 

La structure utimbuf contient les champs suivants : 
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Type 


Signification 


actime 


time_t 


Date du dernier acces au contenu du fichier 


modtime 


time_t 


Date de derniere modification du contenu du fichier 


Pour l'appel utimes( ), il faut passer un tableau de deux structures, la premiere correspondant 
au dernier acces, et la seconde a la derniere modification. Les membres des structures timeval 
sont : 
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Type 


Signification 


tv_sec 


long 


Nombre de secondes ecoulees depuis le 1 er janvier 1 970 


tv_usec 


long 


Nombre de microsecondes (0 a 999 999) 



Linux ne permet pas de memoriser une telle precision, et utimes( ) est ainsi implemente en 
remplissant simplement les champs d'une structure timebuf avant d'appeler utime( ). 

Si le pointeur passe en second argument de utime( ) ou de utimes( ) est NULL, les dates sont 
mises a jour au moment de l'appel. 
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Liens physiques 

Nous avons deja evoque a plusieurs reprises les liens physiques ou liens materiels (hard 
links). Cette notion de lien est un peu trompeuse, car elle suggere une entite inamovible, origi- 
nelle, a laquelle on rattache des avatars de moindre importance. Si cette image peut s'appli- 
quer aux liens symboliques que nous verrons dans le prochain paragraphe, elle est totalement 
erronee dans le cas des liens physiques. 

Lorsqu'on cree un lien physique sur un fichier, on ajoute simplement un nouveau nom dans le 
systeme de fichiers, qui pointe vers le meme i-nceud que le nom original. Neanmoins, il n'y a 
plus aucun moyen de distinguer le nom qui etait le premier et celui qui a ete cree ensuite. Les 
deux noms sont traites avec egalite par le systeme. En fait, il faut considerer que tout nom 
present dans le systeme de fichiers est un lien physique vers le contenu meme du fichier. 

II n'est pas possible de creer dans un repertoire un nom lie a un fichier se trouvant sur un autre 
systeme de fichiers. De plus, certains systemes Unix, dont Linux, n'autorisent pas la creation 
de liens physiques sur un repertoire. On pourrait en effet concevoir une boucle dans le 
systeme de fichiers (un repertoire contenant un sous-repertoire correspondant a son pere), et 
le noyau n'est pas pret a detecter de tels conflits (contrairement a ce qui se passe avec les liens 
symboliques). 

Pour creer un lien materiel, il existe un appel-systeme nomme linkO, decrit par Posix, et 
declare dans <unistd.h> : 

int link (const char * nom_original , const char * nouveau_nom) ; 

Cet appel-systeme etablit done un nouveau lien sur le fichier transmis en second argument, 
creant ainsi un nouveau nom dans le systeme de fichiers. Le champ st_nl i nk de la structure 
stat correspondant a Fi-nceud est incremente. Cette valeur est egalement visible dans la 
seconde colonne affichee lors d'un Is -1 . Notons que le nouveau nom ne sera pas ecrase s'il 
existe deja. Si on veut forcer la creation, il faut l'effacer auparavant. 

Nous comprenons a present pourquoi 1' appel-systeme d'effacement d'un nom de fichier se 
nomme unl ink( ), puisqu'il sert simplement a supprimer un lien physique sur le contenu du 
fichier et a decrementer ainsi le champ st_nlink. Lorsque ce dernier arrive a zero, l'espace 
occupe sur le disque est reellement libere. 

II existe une application /bin/In qui sert de frontal a 1' appel-systeme linkO. Lorsque nous 
ne precisons aucune option, cet utilitaire cree un lien physique. En voici un exemple d'utili- 
sation : 

$ Is -1 exemple_tailles.c 

-rw-rw-r-- 1 ccb ccb 1219 Dec 30 17:56 exemple_tailles.c 

$ In exemple_tailles.c deuxieme_nom.c 
$ Is -1 exemple_tailles.c deuxieme_nom.c 

-rw-rw-r-- 2 ccb ccb 1219 Dec 30 17:56 deuxieme_nom.c 

-rw-rw-r-- 2 ccb ccb 1219 Dec 30 17:56 exemple_tailles.c 

$ rm deuxieme_nom.c 
$ Is -1 exemple_tailles.c 

-rw-rw-r-- 1 ccb ccb 1219 Dec 30 17:56 exemple_tailles.c 

$ 
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Nous remarquons que le champ st_nl i nk de la structure stat, affiche en seconde colonne du 
resultat de 1 s -1 , passe bien a 2, puis revient a 1 apres la destruction de Fun des noms. Veri- 
fions a present que les liens materiels sont interdits sur les repertoires et entre plusieurs 
systemes de fichiers differents : 

$ In /tmp . 

In: /tmp: hard link not allowed for directory 
$ mount /mnt/dos 
$ In /mnt/dos/autoexec.bat . 

In: cannot create hard link './autoexec.bat' to " /mnt/dos/autoexec.bat' : 
Invalid cross-device link 

$ 

Les liens physiques sont souvent utilises pour donner plusieurs noms differents a la meme 
application, de maniere transparente vis-a-vis de Putilisateur. Dans mon systeme actuel, 
je peux ainsi verifier la presence de plusieurs liens physiques dans le repertoire /bin par 
exemple : 

$ Is -1 /bin | grep "r-x 2" 

-rwxr-xr-x 2 root root 150964 Jul 1 1999 gawk 

-rwxr-xr-x 2 root root 150964 Jul 1 1999 gawk-3.0.4 

$ Is -1 /bin | grep "r-x 3" 

-rwxr-xr-x 3 root root 50384 Mar 25 1999 gunzip 

-rwxr-xr-x 3 root root 50384 Mar 25 1999 gzip 

-rwxr-xr-x 3 root root 50384 Mar 25 1999 zcat 

$ 

L' application gzip se presente ainsi sous trois noms differents. Lorsque le programme 
demarre, il analyse argv[0] dans la fonction main( ) pour savoir comment se comporter. On 
peut aussi utiliser Foption -d de gzip pour assurer une decompression, mais l'appel « gzip 
-d fichier.gz » est moins intuitif que « gunzip fichier.gz ». Lorsqu'on voit qu'un 
fichier dispose de plusieurs noms grace a la seconde colonne de 1 s -1, il n'est toutefois pas 
possible de savoir immediatement oil ils se trouvent. La taille du fichier est un indice serieux 
mais pas totalement sur. On peut se servir de l'application find avec son option -inum pour 
comparer le numero d'i-nceud. Ce dernier est affiche avec l'option -i de Is. En voici un 
exemple : 

$ Is -i -1 /usr/bin/gcc 

62459 -rwxr-xr-x 3 root root 64604 Sep 8 23:11 /usr/bin/gcc 

L executable gcc a done trois noms differents. Recherchons-les avec find, a partir de /us r, en 
utilisant Foption -xdev (inutile de parcourir les autres systemes de fichiers, tous les liens 
physiques doivent resider sur le meme) et -inum pour trouver les fichiers dont le numero 
d'i-nceud soit 62459 : 

$ find /usr -xdev -inum 62459 

/usr/bin/i386-redhat-l inux-gee 
/usr/bin/eges 
/usr/bin/gcc 
$ 
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Liens symboliques 

Contrairement a leurs homonymes physiques, les liens symboliques (soft links ou symbolic 
links) sont soumis a un nombre moins important de contraintes. lis sont egalement imple- 
mented conceptuellement a un niveau plus eleve dans l'organisation du systeme de fichiers. 

Un lien symbolique n'est rien de plus qu'un petit fichier de texte comprenant le chemin 
d'acces et le nom du fichier vers lequel il pointe. Le lien est egalement marque par un type 
special - qu'on determine grace a la macro S_ISLNK() appliquee au champ stjiode de la 
structure stat - et qui permet au noyau de le reconnaitre. Avec certains appels-systeme, le 
noyau agira alors sur le contenu du lien, en operant sur le fichier vise, alors que d'autres 
primitives fonctionneront directement sur le lien symbolique lui-meme. 

Un lien symbolique est cree grace a l'appel syml i nk( ) , declare dans <uni std . h> : 

int symlink (const char * nom_original , const char * nouveau_nom) ; 
On peut utiliser aussi Putilitaire / b i n / 1 n avec 1' option -s pour creer un lien symbolique. 



Attention 

II est tout a fait possible de creer un lien symbolique pointant vers un fichier inexistant. Le systeme indiquera 
une erreur lors de la tentative d'ouverture. De meme, si le fichier vise est supprime, les liens symboliques qui 
pointaient vers lui ne sont pas concernes. 



En consequence, on peut alors creer un lien symbolique entre differents systemes de fichiers 
et creer des liens sur des repertoires. On peut aussi concevoir des boucles dans les liens, ce 
que le systeme detectera lors des tentatives d'acces. 

Voici la creation d'un lien symbolique normal et sa suppression : 
$ Is -1 Makefile 

-rw-r--r— 1 ccb ccb 203 Dec 30 23:22 Makefile 
$ In -s Makefile Makefile. 2 
$ Is -1 Makefile* 
-rw-r--r-- 1 ccb 
lrwxrwxrwx 1 ccb 
$ rm Makefile. 2 
$ Is -1 Makefile* 
-rw-r— r-- 1 ccb 
$ 

La taille d'un lien symbolique est limitee a la longueur du chemin qu'il contient (toutefois 
l'allocation de l'espace sur le disque est assuree par blocs beaucoup plus gros). Voici un 
exemple de lien symbolique pointant vers un fichier inexistant : 

$ In -s /tmp/je_n_existe_pas ici 
$ Is -1 ici 

lrwxrwxrwx 1 ccb ccb 20 Jan 2 00:44 ici -> /tmp/je_n_exi ste_pas 
$ cat ici 

cat: ici: Aucun fichier ou repertoire de ce type 

$ rm ici 

$ 



ccb 203 Dec 30 23:22 Makefile 

ccb 8 Jan 2 00:41 Makefile. 2 -> Makefile 

ccb 203 Dec 30 23:22 Makefile 
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Un lien symbolique peut contenir un chemin absolu depuis la ratine du systeme de fichiers ou 
un chemin relatif a base de . / ou . . / . Cette derniere solution est souvent preferable, surtout si 
le repertoire est susceptible d'etre exporte par le systeme NFS pour etre visible sur d'autres 
systemes n'ayant pas la meme arborescence. Notons que certains systemes de fichiers (par 
exemple msdos ou vf at) ne permettent pas la creation de liens symboliques. 

Les permissions d'acces a un lien symbolique ne sont jamais prises en compte, aussi sont- 
elles fixees automatiquement a rwxrwxrwx. Le nom du proprietaire d'un lien symbolique n'a 
que rarement de l'interet. Le seul cas ou cette information est utile est celui ou le lien reside 
dans un repertoire public ayant son bit Sticky a 1, ce qui signifie que seul root ou le proprie- 
taire d'un fichier peuvent l'effacer ou le modifier. 

Les liens symboliques sont une methode tres commode pour configurer un systeme, particu- 
lierement dans une arborescence de fichiers source. On utilise par exemple souvent des liens 
symboliques dans des applications portees sur plusieurs plates-formes, pour faire pointer un 
seul fichier Makefile au choix vers Makefile. linux, Makefile. aix, Makefile. Solaris, Make- 
file . hpux , etc. De meme, chaque equipe de developpement a souvent une petite bibliotheque 
de fichiers source reutilises dans plusieurs projets. Ces fichiers peuvent etre conserves en un 
seul exemplaire, permettant ainsi une mise a jour automatique en cas de correction a apporter, 
tout en ayant des liens symboliques dans les arborescences de chaque projet qui les utilise. 

Le lien symbolique presente l'avantage d'etre une indirection explicite, facilement visible, au 
contraire des liens physiques. Ceci permet de changer l'emplacement reel d'un fichier, tout en 
le laissant accessible a partir d'un autre repertoire ou il etait place historiquement. C'est le cas 
du repertoire /usr/tmp qu'on conserve pour des raisons historiques, mais qui est generale- 
ment lie symboliquement au repertoire /var/tmp. La partition /usr doit en effet pouvoir etre 
montee en lecture seule (voire depuis un serveur NFS). Alors que /var est souvent une parti- 
tion locale, comme /trap, sur laquelle on peut eventuellement recreer le systeme de fichiers a 
chaque redemarrage de la machine. Les liens symboliques sont alors des outils precieux pour 
les administrateurs qui gerent un pare de plusieurs machines heterogenes utilisant la meme 
arborescence /usr depuis un serveur NFS, puisqu'ils permettent d'employer un lien symbo- 
lique dans la partition commune, comme le lien /usr/XHR6/lib/Xll/XF86Config vers un 
fichier dependant de chaque machine /etc/Xll/XF86Conf i g. 

Lorsqu'on utilise open( ) sur un lien symbolique, cet appel-systeme tente d'acceder au fichier 
vise. Pour connaitre le veritable contenu du lien (le chemin vers lequel il pointe), il faut 
employer un appel-systeme different, nomme readl i nk( ), declare dans <uni std . h> : 

int readlink (const char * nom_lien, char * buffer, size_t taille); 

Cet appel-systeme recopie dans le buffer passe en deuxieme argument le contenu du lien dont 
le nom est passe en premiere position. II limite la longueur de la copie a la taille fournie en 
troisieme argument, mais n'ajoute pas de caractere nul. 

La valeur renvoyee vaut -1 en cas d'echec. Si readl ink() reussit, il renvoie le nombre de 
caracteres copies. Si ce nombre est egal a la taille maximale, on recommencera done l'appel 
avec un buffer plus grand, comme dans F exemple suivant : 

exemple_readlink.c : 

//include <stdlib.h> 
//include <unistd.h> 
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void 

lecture_contenu (const char * nom) 
{ 

char * buffer = NULL; 

char * nouveau = NULL; 

int taille = 0; 

int nb_copies; 



while (1) { 

taille += 16; 

if ((nouveau = realloc(buffer, taille)) == NULL) { 
perror(nom) ; 
break; 

} 

buffer = nouveau; 

if ((nb_copies = readl ink(nom, buffer, taille - 1)) == -1) { 

perror(nom) ; 
if (nb_copies < taille - 1) ( 

buffer[nb_copies] = '\0'; 

fprintf (stdout, "%s : %s\n", nom, buffer); 

break; 




f ree(buffer) ; 



int 

main (int argc, char * argv[]) 

{ 

int i; 

for (i =1; i < argc; i ++) 
lecture_contenu(argv[i]) ; 

return EXIT_SUCCESS; 

} 

Dans l'execution suivante, nous creons un lien dont le contenu est largement plus long que 
16 caracteres pour verifier que notre routine fonctionne : 

$ In -s /etc/services . 

$ In -s /usr/XHR6/incl ude/Xll/bitmaps/escherknot . 
$ ./exemple_readlink services escherknot 

services : /etc/services 

escherknot : /usr/XHR6/include/Xll/bitmaps/escherknot 

$ rm escherknot services 

$ 

II n'est pas toujours evident de savoir si un appel-systeme s'applique au lien symbolique lui- 
meme ou a son contenu. En regie generale, le comportement des appels-systeme est dicte par 
le bon sens. En voici toutefois un recapitulatif rapide pour les principales primitives de traite- 
ment des fichiers : 
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Appel-systeme concerne le lien lui-meme concerne le fichier vise 

access 

chdir • 

chmod • 

chown jusqu'a Linux 2.0 depuis Linux 2.2 

execve 

1 chown • 
lstat • 
open 

readlink • 
rename • 

stat • 
truncate • 
unlink • 
utime • 
utimes • 



Noeud generique du systeme de fichiers 

II existe, nous l'avons constate dans la structure stat, plusieurs types de nceuds, qu'on peut 
rencontrer dans un systeme de fichiers. Tout d'abord, on trouve les fichiers reguliers qu'on 
cree avec F appel-systeme openO ou create ) ; bien entendu, il existe egalement les reper- 
toires, crees avec mkdirO, ainsi que les liens physiques et symboliques issus de linkO et 
symlinkO. Les sockets ne se trouvent generalement pas dans le systeme de fichiers 1 , mais 
leurs descripteurs - fournis par 1' appel-systeme socketO que nous analyserons dans le 
chapitre 32 - sont manipules comme les descripteurs de fichiers et peuvent etre transmis en 
argument de f stat( ). On peut encore trouver trois types de nceuds : les files FIFO, les fichiers 
speciaux de peripherique de type caractere, et ceux de type bloc. Pour creer ce genre de 
nceuds, on utilise 1' appel-systeme mknod( ) , declare dans <sys/stat . h> : 

int mknod (const char * nom, mode_t mode, dev_t periph); 

Le premier argument de cet appel-systeme indique le nom du nceud a creer, et le mode precise 
a la suite doit etre l'une des constantes suivantes : 



Nom Signification 

S_I FREG Creation d'un fichier regulier vide, equivalent d'un opent ) suivi d'un close ( ). Letroisieme argument de 
mknodt ) est ignore. Ce mode de fonctionnement ne nous interessera pas ici. 

S_I FI F0 Creation d'une file FIFO. Ce type de fichier est habituellement cree a I'aide de la fonction de bibliotheque 
mkfifoO, que nous analyserons dans le chapitre 28. II s'agit d'un moyen de communication entre 
processus. La creation d'une FIFO avec mknod ( ) ne nous interessera pas non plus. 



1. Dans certaines situations, une socket peut quand meme avoir un nom dans le systeme de fichiers. C'est le cas par exemple de 
/dev/1 og ou de /dev/pri nter. Leur comportement dans ce cas s'apparente assez a celui d'une file FIFO. 
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Norn Signification 

S_I FBLK Creation d'un fichier special de peripherique de type bloc. 
S_I FCHR Creation d'un fichier special de peripherique de type caractere. 

Dans le cas d'un fichier special de peripherique (bloc ou caractere), le troisieme argument 
indique au noyau le type du pilote de peripherique desire. Cette valeur est composee de deux 
nombres, qu'on nomme numero majeur et numero mineur du peripherique. Le numero 
majeur permet au noyau de determiner quel pilote de peripherique est concerne lorsqu'on 
tente une ouverture, une lecture ou une ecriture sur le nceud dont il est question. Le numero 
mineur est reserve au pilote lui-meme, pour pouvoir differencier plusieurs dispositifs mate- 
riels par exemple. 

Lorsqu'un pilote est charge en memoire, il indique au noyau le type de peripherique pour 
lequel il est competent, en lui transmettant une structure file_operations decrite dans le 
fichier d'en-tete <1 i nux/f s . h>. Ce mecanisme est interne au noyau, mais il est interessant de 
le comprendre pour bien saisir le role des fichiers speciaux. A l'instar des methodes definies 
pour les classes en programmation orientee objet, la structure file_operations contient des 
pointeurs sur les fonctions que le pilote est capable de fournir pour le peripherique : 



Norn du champ 


Role 


1 seek 


Fonction appelee pour deplacer la position de lecture ou d'ecriture sur le peripherique. 


read 


Fonction de lecture depuis le peripherique. 


write 


Fonction d'ecriture sur le peripherique. 


readdi r 


Fonction de lecture du contenu d'un repertoire servant a homogeneiser I'implementation 
des systemes de fichiers, mais non utilisee sur les peripheriques. 


poll 


Fonction permettant de surveiller la disponibilite des donnees en lecture ou en ecriture ; 
ceci sera etudie dans le chapitre 30. 


ioctl 


Point d'entree permettant d'assurer des operations particulieres sur un peripherique 
autres que les lectures ou ecritures, par exemple ejection d'un CD, programmation de la 
parite d'une interface serie, etc. 


mmap 


Fonction demandant la projection du contenu du peripherique en memoire. 


open 


Fonction d'ouverture et d'initialisation du peripherique. 


flush 


Demande de vidage des buffers associes a un peripherique. 


rel ease 


Fonction de fermeture et liberation d'un peripherique, equivalent de cl ose ( ) . 


f sync 


Fonction de synchronisation du contenu du peripherique et de ses buffers associes. 


f async 


Demande de fonctionnement asynchrone du peripherique. 


check_media_change 


Fonction verifiant si le support amovible contenu dans le peripherique a ete modifie (par 
exemple un CD). 


revalidate 


Fonction de gestion du buffer cache. 


1 ock 




Fonction de verrouillage du peripherique. 



Lorsqu'on demande l'ouverture d'un fichier special de peripherique, par exemple un port 
serie, le noyau verifie le numero majeur et appelle la fonction open ( ) du pilote correspondant, 
en lui transmettant diverses informations, dont le numero mineur desire. Bien sur, certains 
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pilotes de peripheriques n'implementent pas toutes les fonctions indiquees precedemment (on 
ne peut pas deplacer avec 1 seek( ) la position de lecture sur un port de communication serie), 
aussi existe-t-il des routines par defaut, permettant de renvoyer une erreur par exemple. 

Les numeros majeur et mineur d'un fichier special sont done essentiels pour la comprehen- 
sion entre le noyau et le pilote de peripherique, contrairement au nom du fichier special qui 
n'a aucune importance. Les numeros reserves sont decrits dans le fichier Documentation/ 
devices.txt accompagnant les sources du noyau. Par exemple, les ports de communication 
serie sont geres avec le numero majeur 5 et les numeros mineurs 64, 65, 66 pour les ports 
COM1, COM2, COM3 (nommes generalement ttySO, ttySl, ttyS2 sous Linux). On peut le 
constater en examinant les cinquieme et sixieme colonnes de la commande Is -1 sur les 
fichiers speciaux correspondants : 



$ cd /dev 


















$ Is -1 cus* 


















crw-rw-rw- 


1 


root 


root 


5, 


64 May 


5 


1998 


cuaO 


crw 


1 


root 


root 


5, 


65 May 


5 


1998 


cual 


crw 


1 


root 


root 


5, 


66 May 


5 


1998 


cua2 


crw 

$ 


1 


root 


root 


5, 


67 May 


5 


1998 


cua3 



Le caractere 'c' en tete de la premiere colonne indique qu'il s'agit d'un peripherique special 
de type caractere. D'autres peuvent etre de type bloc : 



$ Is -1 


hdal* 


















brw-rw- 


--- 1 


root 


disk 


3, 


1 


May 


5 


1998 


hdal 


brw-rw- 


--- 1 


root 


disk 


3, 


10 


May 


5 


1998 


hdalO 


brw-rw- 


--- 1 


root 


disk 


3, 


11 


May 


5 


1998 


hdall 


brw-rw- 


--- 1 


root 


disk 


3, 


12 


May 


5 


1998 


hdal2 


brw-rw- 


--- 1 


root 


disk 


3, 


13 


May 


5 


1998 


hdal3 


brw-rw- 


--- 1 


root 


disk 


3, 


14 


May 


5 


1998 


hdal4 


brw-rw- 


--- 1 


root 


disk 


3, 


15 


May 


5 


1998 


hdal5 


brw-rw- 


--- 1 


root 


disk 


3, 


16 


May 


5 


1998 


hdal6 



$ 

La difference entre peripheriques caractere et bloc reside dans la maniere d'acceder aux 
donnees. Dans un cas, elles arrivent octet par octet, dans l'autre des blocs complets sont affectes 
pour la lecture ou Fecriture. Un corollaire de cette distinction est qu'un peripherique de type 
bloc peut generalement contenir un systeme de fichiers, ce qui n'est pas possible avec un 
peripherique en mode caractere. Lessentiel des peripheriques de type bloc est constitue de 
disques durs, de lecteurs de disquettes et de CD-Rom. Lorsqu'on developpe un driver person- 
nalise pour assurer 1' interface avec un peripherique qui est aussi personnalise (par exemple un 
instrument de mesure), on utilise done generalement un pilote de type caractere. 

Pour creer un nouveau nceud du systeme de fichiers qui represente un fichier special de peri- 
pherique, on utilise generalement Futilitaire /bi n/mknod, qui prend en arguments la lettre b ou 
c (suivant le type de peripherique), le numero majeur et le numero mineur. Cette application 
sert ainsi de frontal a l'appel-systeme mknod( ), dont le troisieme argument regroupe les deux 
numeros mineurs sous forme d'une valeur dev_t, composee ainsi : 

dev_t periph; 
| periph = (majeur << 8) | mineur; 

Le numero mineur est done limite a Fespace allant de 0 a 255. 
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La creation directe d'un fichier special, en employant l'appel-systeme mknodt ) , est assez rare, 
puisqu'on prefere en general creer ces nceuds en utilisant /bi n/mknod, eventuellement dans un 
script shell qui encadre le chargement du module pilote du peripherique correspondant. 

L'appel-systeme mknod( ) donnant un acces direct aux peripheriques materiels relies a l'ordi- 
nateur, il est naturellement reserve a Fadministrateur. De meme, les fichiers speciaux de peri- 
pheriques ne sont interpreted en tant que tels par le noyau que si la partition a ete montee avec 
Foption adequate. C'est le cas par defaut pour les systemes de fichiers montes automatique- 
ment au demarrage, mais ceci est desactive pour les supports susceptibles d'etre montes par 
n'importe quel utilisateur, comme les disquettes ou les CD-Rom. 

Masque de creation de fichier 

Lorsqu'un processus cree un fichier, quel que soit son type, les permissions d' acces sont 
filtrees par un masque particulier, qui retire des autorisations. Ce masque peut etre modifie 
avec l'appel-systeme umask( ) , declare dans <sys/stat . h> : 

int umask (int masque); 

Cet appel-systeme permet de configurer le nouveau masque et renvoie sa valeur precedente. 
Lorsqu'un processus dispose par exemple d'un masque 0022 en octal, ce qui est courant, 
meme s'il cree un fichier avec les autorisations 0777 (lecture, ecriture, execution pour tout le 
monde), les bits d' ecriture (correspondant a 2) seront supprimes pour le groupe et le reste des 
utilisateurs. Le fichier ainsi cree aura l'autorisation 0755, ce qui est plus raisonnable. En voici 
un exemple tres simple : 

#include <fcntl .h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <sys/stat.h> 

int 
main (void) 

{ 

int fd; 
int masque; 

masque = umask(O); 

fprintf (stdout, "Ancien masque = £o, nouveau = 0 \n", masque); 
fprintf (stdout, "Tentative de creation de essai. umask \n"); 
fd = openC'essai .umask", 0_RDWR | 0_CREAT | 0_EXCL, 0777); 
if (fd < 0) 

perror( "open" ) ; 

else 

cl ose(fd) ; 
systemC'ls -1 essai .umask") ; 
unlinkC'essai .umask"); 

umask(masque) ; 

fprintf (stdout, "Remise masque = £o \n", masque); 

fprintf (stdout, "Tentative de creation de essai. umask \n"); 
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fd = open( "essai. umask", 0_RDWR | 0_CREAT | 0_EXCL, 0777); 
if (fd < 0) 

perror( "open" ) ; 

el se 

close(fd); 
systemCls -1 essai . umask" ) ; 
unlink("essai .umask"); 
return EXIT_SUCCESS; 

} 

L' execution montre bien la difference des modes lors de la creation d'un fichier : 

$ ./exemple_umask 

Ancien masque = 22, nouveau = 0 
Tentative de creation de essai. umask 

-rwxrwxrwx 1 ccb ccb 0 Jan 3 16:55 essai. umask 

Remise masque = 22 

Tentative de creation de essai. umask 

-rwxr-xr-x 1 ccb ccb 0 Jan 3 16:55 essai. umask 

$ 

Le masque etant herite au cours d'un fork( ) et conserve au cours d'un exec( ), il s'agit avant 
tout d'un dispositif de securite qu'on peut mettre en place dans le script de configuration du 
shell (qui dispose d'une commande de configuration umask interne) pour s'assurer de la confi- 
dentialite des fichiers crees ulterieurement. 

Conclusion 

Ce chapitre nous a permis de faire le point sur les fichiers en tant qu'entites physiquement 
presentes sur les disques. De par les differences existant entre les divers types de systemes de 
fichiers, nous sommes reste a un niveau de description assez eleve, correspondant a celui d'un 
developpement applicatif. 

Pour les lecteurs desireux d'approfondir les concepts sous-jacents au stockage des donnees 
sur disque, on conseillera [Card 1997] Programmation Linux2.0 par exemple, dans lequel le 
systeme de fichiers ext2 est precisement decrit par Fun de ses concepteurs. 

Pour des informations sur les versions plus recentes de Linux, je conseille F excellent 
[Love 2003] Linux Kernel Development qui contient egalement des renseignements sur la 
plupart des autres sous-ensembles du noyau. 
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Le langage C en general et la bibliotheque GlibC ne sont certainement pas les meilleures 
solutions pour manipuler des bases de donnees. II existe de multiples bibliotheques ou 
systemes complets de gestion de bases de donnees permettant d'obtenir sous Linux des resul- 
tats optimaux, tant dans le domaine du logiciel libre comme PostgreSQL que commercial. 

On n'emploiera done pas les fonctionnalites presentees dans ce chapitre pour mettre au point 
de grosses bases de donnees relationnelles. Neanmoins, il arrive qu'un logiciel ait besoin de 
gerer une petite base de donnees, comme fonctionnalite annexe par rapport au but principal de 
F application. 

On peut en trouver un bon exemple en observant un logiciel de composition et d' emission de 
fax. Les fonctionnalites essentielles concerneront la mise en page et la presentation graphique 
du message, 1'importation des fichiers Postscript issus du traitement de texte, et la gestion du 
protocole de transfert. Toutefois la presence d'une petite base de donnees contenant les desti- 
nataires habituels avec leurs numeros de telephone est un atout non negligeable de notre logi- 
ciel. 

De plus en plus d' applications permettent de transmettre directement des resultats, des 
messages, ou des rapports de bogues par courrier electronique, et peuvent aussi tirer profit de 
maniere sensible d'un annuaire des correspondants. Un degre de convivialite supplemental 
est encore atteint si plusieurs applications independantes utilisent le meme annuaire. 

Nous etudierons en premier lieu les bases de donnees DBM, qui sont un heritage historique 
des premiers Unix, ainsi que leurs extensions NDBM. Ensuite, nous examinerons toute F inter- 
face Gnu pour les bases de donnees GDBM. 

Une seconde classe de bases de donnees, nominees DB Berkeley, est disponible avec la GlibC. 
Plus performants que les precedents, ces mecanismes seront etudies par la suite dans ce chapitre. 

Pour F ensemble des exemples decrits ci-dessous, nous aurons besoin de disposer d'un mini- 
mum de donnees consistantes. Pour cela nous utiliserons le fichier /usr/src/1 inux/CREDITS, 
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qui est present sur toutes les stations oil les sources du noyau sont installees. Ce fichier est 
formate de cette facon : 

• Un en-tete ecrit par Linus Torvalds presente les donnees se trouvant a la suite. Cet en-tete 
se termine par une chaine de tirets « » isolee sur une ligne. 

• Des blocs de donnees separes par une ligne vierge decrivent les informations concernant 
les developpeurs du noyau. 

• Au sein de chaque bloc, les trois premiers caracteres de chaque ligne identifient le champ 
correspondant (le troisieme caractere est un espace) ainsi : 



Symbole 

D: 


Contenu 

Description du travail accompli par le contributeur 




E: 


Adresse e-mail 




N: 


Prenoms et nom 




P: 


Cle de validation PGP 




S: 


Adresse postale 




W: 


Adresse web 





Des lignes de commentaires peuvent apparaitre, precedees du symbole diese #. 
Voici un extrait du fichier contenu dans les sources du noyau 2.6.9 : 

This is at least a partial credits-file of people that have 
contributed to the Linux project. It is sorted by name and 
formatted to allow easy grepping and beautification by 
scripts. The fields are: name (N), email (E), web-address 
(W), PGP key ID and fingerprint (P), description (D), and 
snail-mail address (S). 
Thanks , 

Linus 



N: Matti Aarnio 

E: mea@nic.funet.fi 

D: Alpha systems hacking, IPv6 and other network related stuff 

D: One of assisting postmasters for vger.rutgers.edu's lists 

S: (ask for current address) 

S: Finland 

N: Dragos Acostachi oai e 

E: dragos@iname.com 

W: http://www.arbornet.org/~dragos 

D: /proc/sysvipc 

S: C. Negri 6, bl . D3 

S: Iasi 6600 

S: Romania 



[...] 
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H: Marc Zyngier 

E: maz@wild-wind.fr.eu.org 

D: MD driver 

S: 11 rue Victor HUGO 

S: 95560 Montsoult 

S: France 

# Don't add your name here, unless you really _are_ after Marc 

# alphabetically. Leonard used to be very proud of being the 

# last entry, and he'll get positively pissed if he can't even 

# be second-to-last, (and this file really _is_ supposed to be 

# in alphabetic order) 

Nous allons done ecrire une routine capable de parcourir ce fichier et de remplir des chaines 
de caracteres contenant les champs nom (et prenoms), adresse e-mail et site web. Comme 
certains champs peuvent s'etendre sur plusieurs lignes du fichier original, on invoquera 
real 1 oc( ) pour allonger les chaines comme il le faut. 

A la fin de chaque bloc, notre routine fera appel a une fonction d'ajout dans la base de 
donnees, qui variera suivant les interfaces utilisees. 



Bases de donnees Unix DBM 

Les premieres bases de donnees qui furent largement repandues sous Unix etaient gerees par 
une interface nommee DBM pour Database Manager. Peu performantes, ces routines ne 
permettaient pas de manipuler simultanement plus d'une base par programme ni de gerer 
correctement un acces concurrentiel. 

Une interface amelioree fut definie par la suite et nommee NDBM pour New DBM. Elle auto- 
risait un verrouillage du fichier pour eviter les acces simultanes et ajoutait la possibilite de 
manipuler plusieurs bases dans la meme application. 

Finalement, le projet Gnu fournit une bibliotheque nommee GDBM, offrant quelques amelio- 
rations et une compatibilite ascendante avec DBM et NDBM. Nous etudierons ces trois inter- 
faces successivement. 

Pour utiliser la bibliotheque GDBM, il faut ajouter 1' argument -1 gdbm en ligne de commande 
de l'editeur de liens. Les fichiers d'en-tete a inclure sont les suivants : 





Interface 


Fichier d'en-tete 




DBM 




<gdbm/dbm. h> 




NDBM 




<gdbm/ndbm.h> 




GDBM 




<gdbm.h> ou <gdbm/gdbm.h> 





Les bases DBM permettent de stocker des associations entre des donnees et des cles. Le stoc- 
kage est assure par 1' intermediate d'une table de hachage extensible, comme nous en avons 
deja examinee dans le chapitre 17. La base de donnees est enregistree dans deux fichiers 
complementaires, avec les suffixes .pag et .dir. Sous Linux, un seul fichier est utilise. Pour 
conserver toutefois l'aspect original de l'interface DBM historique, avec ses deux fichiers, la 
bibliotheque cree deux liens materiels sur le meme contenu. 
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Les donnees, comme les cles, sont representees par un type datum, structure contenant au 
minimum les champs suivants : 



Norn 


Type 




Signification 


dptr 


char * 


Donnee proprement dite 




dsize 


i nt 


Longueur des donnees 





Pour ouvrir une base de donnees, on emploie la fonction dbminitO. Elle prend en argument 
le nom de la base (sans les extensions . pag et .di r). Ces deux fichiers doivent exister avant 
d'appeler dbminit( ). 

int dbminit (const char * nom); 

Si les fichiers n'existent pas, dbminitO les cree avec un mode d'acces entierement nul, ne 
permettant done aucune manipulation. On pourra done employer systematiquement avant 
dbminitO un code du genre : 

if ((fp = fopen ("base_de_donnees.pag", "a")) != NULL) 
fclose (fp); 

if ((fp = fopen ( "base_de_donnees .di r" , "a")) != NULL) 

fclose (fp); 
dbminit ( "base_de_donnees" ) ; 

La fonction dbminit( ) de la bibliotheque GDBM retablira correctement les deux liens mate- 
riels sur le meme fichier. 

Si dbminit( ) echoue, elle renvoie -1 au lieu de 0 et remplit la variable errno. Avec la biblio- 
theque GDBM, la base est verrouillee durant l'ouverture - avec un verrou consultatif -, ne 
permettant done qu'un seul acces a la fois. 

La fermeture de la base se fait avec la fonction dbmel ose( ) : 
int dbmclose (void) ; 

Pour enregistrer une paire cle/donnee dans la base, on emploie la fonction storeO. Son 
prototype est le suivant : 

int store (datum cle, datum donnee); 

Si store( ) reussit, elle renvoie zero. Si une erreur se produit, elle renvoie -1 et remplit errno. 
Si la cle existe deja dans la base, cette fonction transmet une valeur positive. La cle doit done 
etre un identifiant unique. Faute d'en avoir dans la liste des contributeurs de Linux, nous 
allons en creer une artificiellement en numerotant les enregistrements. Cette methode n'est 
pas tres intelligente car nous ne stockons pas le nombre de donnees dans la base. Si on veut 
ajouter ulterieurement d'autres contributeurs, il faudra balayer toute la base afin de compter 
les enregistrements pour creer une nouvelle cle. 

Pour enregistrer nos donnees Nom et prenoms, Adresse e-mail et Site web en une seule fois, 
nous mettons les chaines bout a bout. Le programme suivant permet de creer une base de 
donnees DBM en lisant le fichier des contributeurs : 
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cree_dbm.c : 

#define _GNU_SOURCE /* pour stpcpyO */ 
^include <stdio.h> 
^include <stdlib.h> 
#include <string.h> 
#include <gdbm/dbm.h> 

static void construit_base (void); 

static char * fichier_credits = "CREDITS"; 

int 

main (int argc, char * argv[]) 

{ 

FILE * fp; 
char * fichier; 
if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s nom_base \n", argv[0]); 

exi t( EXIT_FAI LURE) ; 

} 

fichier = malloc(strlen(argv[l]) + 5); 

strcpy(fichier,argv[l]) ; 

s treat (fi chier , " .pag" ) ; 

if ((fp = fopen(fichier, "a")) != NULL) 

fcl ose(fp) ; 
strcpy(fichier, argv[l]); 
strcat(fichier, ".dir"); 
if ((fp = fopen(fichier, "a")) != NULL) 

fcl ose(fp) ; 
free(fichier) ; 

if (dbminit(argv[l]) ! = 0) { 
perrorC'dbminit"); 
exi t( EXIT_FAI LURE) ; 

} 

construit_base( ) ; 

dbmclose( ) ; 

return EXIT_SUCCESS; 



static void 
construit_base (void) 
{ 

FILE * fichier; 

char ligne[256]; 

char * fin_ligne; 

size_t debut_ligne; 

int i = 0; 

char * nom = NULL; 

char * email = NULL; 

char * web = NULL; 

char * chaine; 

datum cle; 
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datum donnee; 
int retour; 

if ((fichier = fopen(fichier_credits, "r")) == NULL) { 
perror(fichier_credits) ; 
return ; 

} 

/* Sauter 1 'en-tete */ 
while (1) { 

if (fgetsdigne, 256, fichier) == NULL) 
return ; 

/* Supprimer commentai res et retours chariot */ 
if ((finjigne = strpbrkd igne, "\n\r#")) ! = NULL) 

fin_ligne[0] = '\0' ; 
if (strncmpd igne, 2) == 0) 

break; 

} 

while (1) { 

if (fgetsdigne, 256, fichier) == NULL) 
return ; 

if ((finjigne = strpbrkd igne, "\n\r#")) != NULL) 

fin_ligne[0] = '\0' ; 
/* Supprimer blancs en debut de ligne */ 
if ((debut_ligne = strspndigne, " \t\n\r")) != 0) 
memmoved igne, ligne + debut_ligne, 

strlendigne + debut_ligne) + 1); 
if (strlendigne) == 0) { 

/* Ligne vide. Si le bloc est pret, on le stocke */ 
if (nom != NULL) { 

cle.dptr = (char *) (& i); 

cle.dsize = sizeof(int); 

/* On colle les champs bout a bout */ 

donnee. dsize = 0; 

if (nom != NULL) 

donnee. dsize += strlen(nom); 
donnee. dsize ++; /* caractere nul */ 
if (email != NULL) 

donnee. dsize += strlen(email ); 
donnee. dsize ++; 
if (web != NULL) 

donnee. dsize += strlen(web); 
donnee. dsize ++; 

donnee. dptr = mal 1 oc(donnee . dsize); 
if (donnee. dptr != NULL) { 

memset(donnee.dptr, '\0', donnee. dsize) ; 

chaine = donnee. dptr; 

if (nom != NULL) 

chaine = stpcpytchaine, nom); 

chaine ++; /* caractere nul */ 

if (email != NULL) 

chaine = stpcpytchaine, email); 

chaine ++; 
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if (web != NULL) 

chaine = stpcpy(chaine, web); 

/* 

* ENREGISTREMENT DES DONNEES 
*/ 

retour = store(cle, donnee); 
if (retour < 0) 

perror( "store" ) ; 
if (retour > 0) 

fprintf (stderr, "Doubl on\n" ) ; 
f ree(donnee.dptr) ; 
donnee. dptr = NULL; 

} 

i ++; 

} 

/* On libere les chaines allouees */ 
if (nom != NULL) free(nom); 
if (email != NULL) f ree(emai 1 ) ; 
if (web != NULL) free(web); 
nom = NULL; 
email = NULL; 
web = NULL; 
continue; 

} 

if (strncmpO igne, "N: ", 3) == 0) { 
if (nom == NULL) { 

if ((nom = malloc(strlendigne) - 2)) != NULL) 

strcpy(nom, & (ligne[3])); 
continue; 

} 

chaine = real 1 octnom, strl en(nom) + strlen(ligne) - 1); 
if (chaine == NULL) 

continue; 
nom = chaine; 

sprintf (nom, "%s %s" , nom, & ( 1 i gne[3] ) ) ; 
continue; 

} 

if (strncmpO igne, "E: ", 3) == 0) { 
if (email == NULL) { 

if ((email = malloc(strlendigne) - 2)) != NULL) 

strcpytemail , & digne[3])); 
continue; 

} 

chaine = real 1 octemai 1 , strlentemail ) + strlen(ligne) - 1); 
if (chaine == NULL) 

continue; 
email = chaine; 

sprintf (email , "%s %s" , email, & ( 1 i gne[3] ) ) ; 
continue; 

} 

if (strncmpdigne, "W: ", 3) == 0) { 
if (web == NULL) { 
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if ((web = malloc(strlen(ligne) - 2)) != NULL) 

strcpy(web, & (ligne[3])); 
continue; 

} 

chaine = realloc(web, strlen(web) + strlen(ligne) - 1); 
if (chaine == NULL) 

continue; 
web = chaine; 

sprintf(web, "%s %s" , web, & (ligne[3])); 
continue; 

} 

} 

fclose(fichier) ; 

} 

Commengons done par creer notre base : 

$ ./cree_dbm credits 
$ Is -1 credits* 

-rw-rw-r-- 2 ccb ccb 34892 Feb 15 17:37 credits. dir 
-rw-rw-r-- 2 ccb ccb 34892 Feb 15 17:37 credits. pag 
$ 

Les deux fichiers sont en realite deux liens physiques sur le meme fichier (on le remarque 
grace au 2 en seconde colonne). 

Pour lire les informations contenues dans une base, on emploie la fonction fetch ( ) , qui renvoie 
la donnee associee a une cle : 

datum fetch (datum cle); 

Si la cle n'existe pas dans la base, le champ dptr de la structure datum renvoyee est NULL. Nous 
creons done un programme qui recherche les enregistrements associes aux numeros passes 
sur la ligne de commande a la suite du nom de la base : 

cherche_cle_dbm.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <gdbm/dbm.h> 

void affiche_contributeur (datum cle, datum donnee); 
int 

main (int argc, char * argv[]) 
{ 

datum cle; 
datum donnee; 
int i ; 
int numero; 

if (argc < 2) { 

fprintf (stderr, "Syntaxe : %s nom_base cles...\n", argv[0]); 
exit(EXIT_FAILURE); 
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} 

if (dbminit(argv[l]) != 0) { 
perrorC'dbminit"); 
exi t( EXIT_FAI LURE) ; 

} 

for (i = 2; i < argc; i ++) { 

if (sscanf (argv[i ] , "M", & numero) == 1) { 
cle.dptr = (char *) (& numero); 
cle.dsize = sizeof(int); 
donnee = fetch(cle) ; 
if (donnee. dptr != NULL) 

aff iche_contributeur(cl e, donnee) ; 

el se 

fprintf (stderr, "Is : inconnu\n", argv[i]); 

} 

} 

dbmcloseO; 

return EXIT_SUCCESS; 



void 

affiche_contributeur (datum cle, datum donnee) 
{ 

char * nom; 
char * emai 1 ; 
char * web; 

nom = donnee. dptr; 

email = & (nom[strl en(nom) + 1]); 

web = & (emai 1 [strl en(emai 1 ) + 1]); 

fprintf (stdout, "Numero : %d\n", * (tint *) cle . dptr)); 

fprintf (stdout, " Nom : %s\n", nom); 

fprintf (stdout, " Email : £s\n", email); 

fprintf (stdout, " Web : %s\n", web); 

} 

Nous pouvons deja interroger notre base ainsi : 

$ ./cherche_cle_dbm credits 31 411 500 

Numero : 31 

Nom : Donald Becker 

Email : becker@cesdis.gsfc.nasa.gov 

Web : 
Numero : 411 

Nom : Theodore Ts'o 

Email : tytso@mit.edu 

Web : 
500 : inconnu 
$ 

Les donnees renvoyees par fetch () doivent etre considerees comme se trouvant dans une 
zone de donnees statique, susceptible d'etre ecrasee a chaque appel. 



596 



Programmation systeme en C sous Linux 



Si on desire effacer un enregistrement, il suffit d'utiliser la fonction del ete( ), qui renvoie 0 si 
elle reussit ou une valeur negative si 1' enregistrement n'est pas trouve. Lorsqu'un enregistre- 
ment est efface, le fichier n'est pas reduit pour autant. Par contre, l'espace sera reutilise par la 
suite. 

int delete (datum cle) ; 

II est possible de balayer sequentiellement le fichier au moyen des routines first_key() et 
next_key ( ) , qui renvoient respectivement la premiere cle du fichier et la cle se trouvant apres 
celle qui est passee en argument. 

datum first_key (void); 
datum next_key (datum cle); 

Lorsque la fin du fichier est atteinte, le champ dptr de la cle renvoyee est NULL. On utilise 
generalement un balayage du genre : 

for (cl e=f i rst_key ( ) ; cle . dptr != NULL; cle = next_key (cle)) { 



Les bases de donnees DBM etant organisees sous forme de tables de hachage, l'ordre des 
elements renvoyes par firstkeyO et nextkeyO est imprevisible, et peut varier lors d'une 
modification de la base. 

Le programme suivant permet de rechercher un nom dans la base, en parcourant tous les enre- 
gistrements et en utilisant strstr( ) pour selectionner les contributeurs a afficher. 

cherchejiomdbm.c : 

#include <stdio.h> 
//include <stdlib.h> 
#include <string.h> 
#include <gdbm/dbm.h> 

void affiche_contributeur (datum cle, datum donnee); 
int 

main (int argc, char * argv[]) 
{ 

datum cle; 
datum donnee; 
char chaine[256]; 
char * fin_chaine; 

if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s nom_base\n", argv[0]); 
exit(EXIT_FAILURE); 

} 

if (dbminit(argv[l]) != 0) { 
perrort "dbminit" ) ; 
exit(EXIT_FAILURE); 

} 

while (1) { 

fprintf (stdout, "(Nom)> "); 
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if (fgetstchaine, 256, stdin) == NULL) 
break; 

if ((fin_chaine = strpbrk(chaine, "\n\r ")) != NULL) 

* fin_chaine = "\0" ; 
if (strlen(chaine) == 0) 

continue; 

for (cle = firstkeyO; cle.dptr != NULL; cle = nextkey(cle)) { 
donnee = fetch(cl e) ; 
if (donnee. dptr != NULL) 

if (strstr(donnee.dptr, chaine) != NULL) 
aff i che_contributeur(cl e, donnee) ; 

} 

} 

fprintf (stdout, "\n"); 

dbmclose( ) ; 

return EXIT_SUCCESS; 

} 

Nous pouvons interroger a nouveau la base : 

$ ./cherche_nom_dbm credits 
(Nom)> Linus 



Numero : 404 

Nom : Linus Torvalds 

Email : torvalds@odsl.org 

Web : 
(Nom)> Alan 

Numero : 85 

Nom : Alan Cox 

Email : 

Web : http://www.linux.org.uk/diary/ 

(Nom)> Andrea 

Numero : 196 

Nom : Andrea Jaeger 

Email : aj@suse.de 

Web : 

Numero : 12 

Nom : Andrea Arcangeli 

Email : andrea@suse.de 

Web : http://www.kernel.org/pub/linux/kernel/people/andrea 

[...] 



(Nom)> (Controle-D) 

$ 

Par la meme occasion, nous remarquons que la bibliotheque GDBM verrouille Faeces a la 
base de donnees, meme si ce comportement n'est pas celui de l'interface DBM originale. 
Pour cela, on lance cherche_nom_dbm simultanement sur deux terminaux, et la seconde invoca- 
tion echoue ainsi : 

$ ./cherche_nom_dbm credits 

dbminit: Ressource temporal' rement non disponible 
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Les fichiers DBM crees par la bibliotheque GDBM ne sont pas compatibles avec les fichiers 
DBM Unix traditionnels. Si on desire assurer une conversion, on peut utiliser le programme 
conv2gdbm qui est fourni avec cette bibliotheque. Par contre, les interfaces DBM et NDBM 
que nous allons examiner sont en realite emulees a partir de 1' interface GDBM, qui est plus 
complete. Les bases de donnees sont done totalement compatibles quelle que soit 1' interface 
choisie. Enfin, contrairement aux implementations Unix traditionnelles, les bases de donnees 
DBM ne contiennent pas de trous, comme nous en avions observe dans le chapitre 18, et leurs 
tailles n'augmentent pas si on les copie avec les utilitaires classiques cp, tar. .. 

Bases de donnees Unix NDBM 

L' interface DBM presente une deficience evidente avec l'impossibilite de manipuler 
plusieurs bases de donnees en meme temps et l'interdiction d'utiliser la meme base dans 
plusieurs processus concurrents. Elle a done ete etendue par Finterface NDBM, qui corrige 
ces deux points. 

Pour pouvoir gerer plusieurs bases de donnees simultanement, on introduit un type opaque 
DBM, qu'on peut comparer au type FILE. 

La fonction d'ouverture dbm_open() est egalement un peu plus complexe puisqu'elle inclut 
deux arguments supplementaires : 

DBM * dbm_open (const char * nom, int attributs, int mode); 

Ces deux derniers arguments sont identiques a ceux de l'appel-systeme open( ). lis permettent 
d'ouvrir une base de donnees en lecture seule (0_RD0NLY), ou en lecture et ecriture (0_RDWR). Si 
on tente d'ouvrir la base en ecriture seule, la bibliotheque transforme automatiquement 
l'attribut en lecture et ecriture. Si on cree une nouvelle base (avec CLCREAT), le dernier argu- 
ment permet de preciser les autorisations a donner aux fichiers. 

II est a present possible non seulement de manipuler plusieurs bases de donnees simultane- 
ment dans le meme programme, mais aussi d'ouvrir la meme base dans plusieurs processus 
differents en meme temps si Faeces se fait partout en lecture seule. Le verrouillage gere par la 
bibliotheque permet en effet de disposer de plusieurs processus lecteurs en parallele. Bien sur, 
si un processus obtient une ouverture en lecture et ecriture, aucun autre acces n'est possible 
en meme temps - pas meme en lecture seule. 

Si dbm_open( ) echoue, elle renvoie un pointeur NULL et remplit errno. 

Toutes les fonctions de l'interface DBM se retrouvent, avec NDBM, gratifiees d'un premier 
argument supplementaire representant la base de donnees et d'un prefixe permettant de 
les distinguer. On trouve ainsi dbm_cl ose( ), dbm_fetch( ), dbm_del ete( ), ainsi que dbm_ 
f i rstkey ( ) et dbm_nextkey ( ), dont les prototypes sont les suivants : 

void dbm_close (DBM * fichier); 

datum dbm_fetch (DBM * fichier, datum cle); 

int dbm_delete (DBM * fichier, datum cle); 

datum dbm_fi rstkey (DBM * fichier); 

datum dbm_nextkey (DBM * fichier, datum cle); 

La fonction dbm_store( ) dispose encore d'un argument supplementaire : 
int dbm_store (DBM * fichier, datum cle, datum donnee, int attribut); 
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L'attribut indique en derniere position peut prendre Fune des deux valeurs suivantes : 

Norn Signification 

DBM_I NSERT On ajoute I'element dans la base, a condition que la cle ne s'y trouve pas deja. Sinon la fonction 
echoue sans modifier quoi que ce soit. 

DBM_REPLACE On ajoute I'element dans la base si sa cle ne s'y trouve pas. Si un autre element possede deja la 
meme cle, il est remplace. Naturellement, il n'y a toujours qu'une seule occurrence d'une cle 
donnee. 

Quelques routines ont ete ajoutees par rapport a Finterface DBM. Les fonctions dbm_error( ) 
et dbm_cl earerr( ) par exemple permettent de consulter ou d'effacer l'indicateur d'erreur de la 
base de donnees. Ces fonctions ressemblent a ferrorO et a clearerrO que nous avions 
rencontrees dans le chapitre 18. 

int dbm_error (DBM * fichier); 
int dbm_clearerr (DBM * fichier); 

Les fonctions dbm_pagf no( ) et dbm_di rf no( ) doivent renvoyer le numero des descripteurs de 
fichiers correspondant aux fichiers . pag et .dir. Naturellement, ces deux fichiers etant identi- 
ques dans 1' implementation GDBM, il n'y a qu'un seul descripteur utilise. 

int dbm_pagfno (DBM * fichier); 
int dbm_dirfno (DBM * fichier); 

La fonction dbm_rdonly( ) renvoie une valeur booleenne indiquant si la base de donnees a ete 
ouverte en lecture seule. 

int dbm_rdonly (DBM * fichier); 

Pour manipuler les fonctions de l'interface NDBM, on peut tres bien utiliser la base de donnees 
que nous avons constitute dans le paragraphe precedent. II suffit en pratique d'ajouter le 
prefixe dbm_ aux fonctions employees et de gerer 1' argument DBM * supplementaire. Nous 
pouvons par exemple modifier le programme cherche_nom_dbm. c ainsi : 

cherche_nom_nbdm.c : 

#include <fcntl .h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <gdbm/ndbm.h> 

void affiche_contributeur (datum cle, datum donnee); 
int 

main (int argc, char * argv[]) 

{ 

datum cle; 
datum donnee; 
DBM * dbm; 
char chaine[256]; 
char * fin_chaine; 
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if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s nom_base\n", argv[0]); 
exit(EXIT_FAILURE); 

} 

if ((dbm = dbra_open(argv[l], 0_RD0NLY, 0)) == NULL) { 
perror( "dbm_open" ) ; 
exit(EXIT_FAILURE); 

} 

while (1) { 

fprintf (stdout, "(Nom)> "); 
if (fgets(chaine, 256, stdin) == NULL) 
break; 

if ((fin_chaine = strpbrk(chaine, "\n\r ")) != NULL) 

* fin_chaine = '\0' ; 
if (strlen(chaine) == 0) 

continue; 
for (cle = dbm_f i rstkey(dbm) ; 
cle.dptr != NULL; 
cle = dbm_nextkey(dbm, cle)) { 
donnee = dbm_fetch(dbm, cle); 
if (donnee. dptr != NULL) 

if (strstr(donnee.dptr, chaine) != NULL) 
affiche_contributeur(cle, donnee) ; 

} 

} 

fprintf (stdout, "\n"); 
dbm_cl ose(dbm) ; 
return EXIT_SUCCESS; 

} 

On peut alors lancer plusieurs sessions de cette application dans differentes fenetres X-Term 
et observer que Faeces simultane est possible si les processus ouvrent la base de donnees en 
lecture seule. 

Bases de donnees Gnu GDBM 

L' interface NDBM, sans etre tres performante en termes de fonctionnalites de gestion de 
bases de donnees, est quand meme assez largement utilisee sous Unix, par exemple pour 
stocker les informations concernant les services reseau avec NIS. La bibliotheque GDBM 
ajoute quelques extensions Gnu a cette interface. 

Tout d'abord, on notera que les fonctions sont a present prefixees par gdbm_ et que le type 
representant une base de donnees ouverte est GDBM FI LE. 



Attention 

Le type GDBM_FI LE etant deja un pointeur, on le manipule directement et pas sous la forme GDBM_F I LE *. 
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La routine gdbm_open( ) d'ouverture d'une base de donnees est legerement etendue : 

GDBM_FILE gdbm_open (const char * nom, 
int tai 1 1 e_bl oc , 
int attributs, 
int mode, 

void (* fonction_erreur) (const char * message)); 

Le premier argument est le nom de la base de donnees. Contrairement aux fonctions d'ouverture 
des interfaces DBM et NDBM, il s'agit ici du nom complet du fichier. Si on desire acceder a 
la base construite precedemment, on transmettra done le nom du fichier credits. pag ou 
credits. dir. 

Le second argument n'est utilise que lors de la creation de la base. II s'agit de la taille des 
blocs employes pour la lecture ou l'ecriture des donnees. Cette valeur doit etre superieure ou 
egale a 512 pour etre prise en compte, sinon la bibliotheque se sert de la fonction fstat( ) 
pour determiner une taille de bloc optimale. En general, on prendra done une valeur nulle. 

Le troisieme argument est un attribut qui doit d'abord comporter l'une des constantes suivantes : 



Nom 


Signification 


GDBM. 


.READER 


Ouverture d'une base de donnees existante en lecture seule. Plusieurs acces de ce type sont 
possibles de maniere concurrente. 


GDBM. 


.WRITER 


Ouverture d'une base de donnees existante en lecture et ecriture. Un seul processus peut avoir 
acces a la base. 


GDBM. 


.WRCREAT 


Ouverture d'une base de donnees en lecture et ecriture. Si la base n'existe pas, elle est creee. 


GDBM. 


.NEWDB 


Ouverture d'une base de donnees en lecture et ecriture. Si la base n'existe pas, elle est creee. 
Si elle existe deja, elle est ecrasee. 



De plus, ce troisieme argument peut egalement comprendre, par un OU binaire, les constantes 
suivantes : 



Nom Signification 

GDBM_SYNC Synchronisation des ecritures. Les modifications sur la base sont transmises immediatement au 
controleur de disque. Les performances sont legerement degradees. 

GDBM_N0L0CK Pas de gestion du verrouillage de la base. L'application doit fournir sa propre methode pour eviter 
les problemes d'acces simultanes. 

Le quatrieme argument, le mode, correspond aux permissions d'acces qui seront installees sur 
les fichiers de la base de donnees s'ils sont crees. On emploie souvent 0644 ou 0640. 

Finalement, le dernier argument de gdbm_open( ) est un pointeur sur une fonction d'erreur, qui 
sera invoquee en cas de detection d'un probleme fatal sur la base. Cette fonction prend en 
argument une chaine de caracteres correspondant au message d'erreur indiquant le probleme. 
Si on transmet un pointeur NULL, la bibliotheque GDBM fournit un gestionnaire d'erreur 
standard. 

La fonction gdbm_open() renvoie un objet de type GDBM_FI LE, ou NULL en cas d'erreur. La 
valeur d'erreur est transmise dans une variable globale nommee gdbm_errno. Celle-ci est de 
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type gdbm_error. II existe une fonction permettant d'obtenir un libelle dans une chame de 
caracteres statique : 

char * gdbm_strerror (gdbm_error erreur); 

Les fonctions suivantes ont un comportement equivalent a celui de la bibliotheque NDBM : 

void gdbm_close ( GDBM_F I LE fichier) ; 

datum gdbm_fetch ( GDBM_F I LE fichier, datum cle); 

int gdbm_delete ( GDBM_F I LE fichier, datum cle); 

datum gdbm_firstkey ( GDBM_F I LE fichier); 

datum gdbm_nextkey ( GDBM_F I LE fichier, datum cle); 

int gdbm_store ( GDBM_FI LE fichier, datum cle, 
datum donnee, int attribut); 

Le dernier argument de la fonction gdbm_store( ) doit correspondre a l'une des valeurs 
suivantes : 



Norn 




GDBMJNSERT 


Equivalent de DBM_I NSERT pour la bibliotheque NDBM 


GDBM_REPLACE 


Equivalent de DBM_REPLACE pour la bibliotheque NDBM 



La bibliotheque GDBM ajoute egalement plusieurs routines. La fonction gdbm_reorganize( ) 
peut etre invoquee pour « nettoyer » la base de donnees lorsqu'il y a eu beaucoup de suppres- 
sions successives. 

int gdbm_reorganize ( GDBM_F I LE fichier); 

Cette routine permet de recuperer l'espace libere sur le disque. Sinon la base de donnees le 
conservera, pour le reutiliser par la suite. 

Avec la fonction gdbm_sync( ), on peut demander la synchronisation de la base de donnees sur 
le disque, avec son contenu en memoire. Cette routine n'est pas necessaire si on l'a ouverte 
avec l'attribut GDBM_SYNC. 

void gdbm_sync ( GDBM_FI LE fichier); 

La fonction gdbm_exi st( ) permet de verifier si une cle est presente dans la base. 

int gdbm_exist (GDBM_FILE fichier, datum cle); 

Nous avons vu que la bibliotheque GDBM permet d'ouvrir une base de donnees sans faire de 
verrouillage (avec Foption GDBM_NOL0CK). Lapplication doit alors implementer son propre 
mecanisme de synchronisation pour l'acces au fichier. II existe une fonction nommee gdbm_ 
fdesc( ) renvoyant le descripteur associe a la base de donnees : 

int gdbm_fdesc ( GDBM_FI LE fichier); 

Notons que la bibliotheque GDBM permet de configurer certaines options grace a une fonc- 
tion gdbm_setopt( ) , mais qu'il s'agit essentiellement de mecanismes internes de la base, qui 
sont done ici hors de notre propos. Pour plus de details, on pourra se reporter a la documen- 
tation de cette bibliotheque. 
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Afin d'utiliser les routines GDBM, nous allons creer un petit programme permettant de 
parcourir la base pour afficher tout son contenu : 

parcours_gdbm.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <gdbm.h> 

void affiche_contributeur (datum cle, datum donnee); 
int 

main (int argc, char * argv[]) 

{ 

GDBM_FILE base; 
datum cle; 
datum donnee; 

if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s nom_base \n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

if ((base = gdbm_open(argv[l] , 0, GDBM_READER, 0, NULL) ) == NULL ) { 
fprintf (stderr, "%s : £s\n", argv[l] ,gdbm_strerror(gdbm_errno) ) ; 
exit(EXIT_FAILURE); 

} 

for (cle = gdbm_f i rstkey(base) ; 
cle.dptr != NULL; 
cle = gdbm_nextkey(base, cle)) { 
donnee = gdbm_fetch(base, cle); 
if (donnee. dptr != NULL) 

aff iche_contributeur(cl e, donnee) ; 

} 

gdbm_cl ose(base) ; 
return EXIT_SUCCESS; 

} 

Lors de F execution de ce programme, nous pouvons verifier que le nom a transmettre est bien 
celui du fichier complet et, par la meme occasion, faire fonctionner la routine gdm_strerror( ). 

$ . /parcours_gdbm credits 

credits : File open error 
$ . /parcours_gdbm credits. pag 

Numero : 136 

Nom : Bob Frey 

Email : bobf@advansys.com 

Web : 
Numero : 208 

Nom : Jan Kara 

[...] 
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Numero 



97 



Norn 
Emai 1 
Web 



Todd J. Derr 
tjd@fore.com 

http://www.wordsmith.org/~tjd 



Numero 
Nom 
Emai 1 



321 



Yuri Per 

yuri@pts.mipt.ru 



Web 

$ 



Pour terminer, on peut dire que les bases de donnees GDBM sont fiables et simples d'utilisa- 
tion mais que leur champ d' application est assez restreint. Pour obtenir un comportement 
optimal de la base, il faut que les conditions suivantes soient remplies : 

• Acces concurrents limites a la lecture. Plusieurs processus peuvent acceder simultanement 
a la base de donnees a condition qu'ils reclament tous un acces en lecture seule. Si un 
processus demande un acces en ecriture, il devra attendre qu'il n'y ait plus de lecteur sur la 
base. De la meme facon, tant qu'un ecrivain garde un acces sur la base, il n'y a pas de 
consultation possible. 

• Modifications rares et groupees. En corollaire de la premiere condition, on devine qu'il est 
largement preferable que les ecritures soient groupees afin d'eviter de mobiliser la base 
trop frequemment. En cas de suppression de plusieurs enregistrements, on peut demander 
une reorganisation des donnees pour recuperer de la place sur le disque. 

• Existence d'une cle unique identifiant les donnees. La presence d'une cle unique est 
parfois problematique. D'autant que l'interface DBM ne permet pas de rechercher un enre- 
gistrement a l'aide de cles secondares. Pour organiser une base de donnees contenant des 
individus, cela peut poser un veritable probleme 1 . 

La liste des hotes appartenant a un reseau local est un bon exemple de base de donnees 
susceptible d'etre geree en utilisant l'interface DBM. II existe de fait plusieurs identifiants 
uniques pouvant servir de cle (adresse IP, adresse MAC, nom complet). La modification de la 
base est generalement assez rare et peut etre considered comme une operation de maintenance 
avec interruption du service. Les consultations simultanees d'une base centralisee ont lieu en 
lecture seule. 

Dans ces circonstances, on emploiera avec confiance la bibliotheque GDBM, en profitant en 
plus de la portability de son interface NDBM sur de nombreux systemes Unix. 



II existe dans la bibliotheque GlibC une interface permettant de manipuler un second type de 
bases de donnees : les DB Berkeley. Ces bases de donnees peuvent etre organisees sous forme 
de tables de hachage, d'arbres binaires ou d' enregistrements numerates, au gre de l'utilisa- 
teur. II existe une interface generique pour acceder a toutes les fonctionnalites. 



1. Au niveau de l'etat civil, du moins en France, l'unicite est garantie a condition de considerer le quadruplet constitue des 
nom, prenora usuel, date et lieu de naissance. L'utilisation en cle d'acces n'est pas possible car cela ne permet pas la 
moindre tolerance d'erreur. 



Bases de donnees DB Berkeley 
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Cette bibliotheque est fournie sous Linux par la societe Sleepycat Software sous licence Open 
Source. Elle est incluse dans les versions actuelles de la GlibC. 

II y a plusieurs versions de 1' interface d'acces aux bases de donnees DB Berkeley. Nous ne 
presenterons ici que la plus simple d'entre elles, construite autour de la seule fonction dbopen ( ) . 

Les autres versions de cette bibliotheque offrent des possibilites tres larges, notamment en ce 
qui concerne les mecanismes transactionnels et les acces concurrents. Mais cela depasserait le 
cadre de notre etude. Pour plus de renseignements, le lecteur pourra se reporter a la documen- 
tation disponible sur le site web http://www.sleepycat.com. 

Les bases de donnees DB Berkeley sont exploitables grace a une interface en langage C mais 
egalement en C++, Java, Perl, Python ou Tel. Les applications en langage C doivent inclure 
le fichier d'en-tete <db_185>, et il faut ajouter l'option -ldb sur la ligne de commande de 
Fediteur de liens. 

Pour manipuler les cles et les donnees, on utilise un meme type nomme DBT. II s'agit en fait 
d'une structure contenant plusieurs champs, mais nous ne nous servirons que de deux d'entre 
eux : 



Nom 


Type 


Signification 


data 


void * 


Pointeur vers la donnee proprement dite 


si ze 


size_t 


Longueur de la donnee 



II existe d'autres membres dans les objets DBT, aussi faut-il veiller a les initialiser correcte- 
ment a zero avant de les employer. On precede ainsi : 

memset (& dbt, 0, sizeof (DBT)); 

On accede a une base de donnees en invoquant la fonction dbopen ( ), declaree ainsi : 

DB * dbopen (const char * nom_fichier, int attributs, int mode 
DBTYPE type, const void * configuration); 

Les trois premiers arguments de cette routine sont identiques a ceux de l'appel-systeme 
open( ). La plupart du temps, on prendra done 0_RDWR | 0_CREAT pour l'attribut et 0644 pour 
le mode. II est possible de passer un nom de fichier NULL si on desire uniquement manipuler la 
base de donnees en memoire, sans la sauvegarder sur le disque. 

Le quatrieme argument est un type enumere pouvant prendre l'une des valeurs suivantes : 



Nom Signification 

DB_BTREE La base de donnees est organisee sous forme de structure d'arbre binaire. Lacces aux donnees est 
tres rapide, mais leur destruction ne permet pas de recuperer I'espace libera 

DB_HASH La base de donnees est construite comme une table de hachage extensible. 

DB_RECN0 La base de donnees est constitute d'un ensemble d'enregistrements numerates successifs. Cette 
structure est surtout interessante pour stacker des donnees de tailles constantes. 



Finalement, le dernier argument est un pointeur vers une structure de donnees specifique au 
type de base, et permettant de la configurer finement. Si on desire employer une telle struc- 
ture, il faudra l'indiquer a chaque utilisation ulterieure de la base. Sinon, on peut transmettre 
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un pointeur NULL pour utiliser les parametres par defaut. Pour avoir plus de precisions sur les 
parametres et les possibilites propres a chaque type de base, on pourra se reporter aux pages 
de manuel btree(3), hash(3) et recno(3). 

La fonction dbopen( ) renvoie un pointeur sur un objet de type DB, qui represente la base de 
donnees. II s'agit d'une structure regroupant des methodes d'acces a la maniere des classes 
C++. Les membres qui nous interessent sont tous des pointeurs sur des fonctions renvoyant 
une valeur int. 



Nom 


Arguments 


Signification 


close 


(const DB * db) 


Fermeture de la base de donnees. 


del 


(const DB * db, 
const DBT * cle, 
int attributs) 


Suppression de I'enregistrement correspondant a la cle indiquee ou de 
l'enregistrement a la position courante dans la base, si on transmet un attri- 
but R_CURS0R. 


fd 


(const DB * db) 


Obtention du descripteur de fichier associe a la base, sauf si celle-ci reside 

i mini lomont on mommro 
U 1 HCjUtJI 1 Icl 1 L oil llltJIMUIlc. 


get 


(const DB * db, 
const DBT * cle, 

DBT * donnee, 
int attributs) 


Lecture de l'enregistrement correspondant a la cle transmise en argument. 
Les attributs ne sont pas utilises, il faut mettre cet argument a 0. 


put 


(const DB * db, 
const DBT * cle, 
const DBT * donnee, 
int attributs) 


Pour enregistrer les donnees transmises. Si la cle existe deja, I'enregistre- 
ment est ecrase, sauf si I'attribut R_N00VERWRITE est employe. D'autres 
valeurs sont possibles pour les attributs, suivant le type de base de donnees. 


sync 


(const DB * db, 
int attributs) 


Pour synchroniser les donnees en memoire avec le fichier disque. Lattribut 
ne sert pas. 


seq 


(const DB * db, 

DBT * cle, 
DBT * donnee, 
int attributs) 


Recherche sequentielle dans la base de donnees. Avec I'attribut R_F I RST , 
on renvoie la premiere paire cle/donnee de la base, avec R_NEXT on renvoie 
la paire suivante. 



Nous pouvons ainsi ecrire un programme permettant de manipuler une base de donnees de 
maniere generique. Ce logiciel acceptera les commandes suivantes : 

• put : ajout d'un enregistrement ; 

• get : recherche d'un enregistrement ; 

• del : suppression d'un enregistrement ; 

• seq : affichage du contenu de la base ; 

• quit: fermer la base et quitter le programme. 

exemple_dbopen.c : 

#1nclude <db_185.h> 
#incl ude <fcntl .h> 
#include <limits.h> 
#include <stdio.h> 
^include <stdlib.h> 
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#include <string.h> 
#include <sys/types.h> 

void traite_get (DB * db); 
void traite_put (DB * db); 
void traite_del (DB * db); 
void traite_seq (DB * db); 

int 

main (int argc, char * argv[]) 
{ 

DB * db; 
DBTYPE dbtype; 
char saisie[128]; 



if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s fichier type \n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

if (strcasecmp(argv[2] , "btree") == 0) 

dbtype = DB_BTREE; 
else if (strcasecmp(argv[2] , "hash") == 0) 

dbtype = DBJASH; 
else if (strcasecmp(argv[2] , "recno") == 0) 

dbtype = DB_RECN0 ; 
el se { 

fprintf (stderr, "Types bases : btree. hash ou recno\n"); 
exi t( EXIT_FAI LURE) ; 

} 

db = dbopen(argv[l]. 0_CREAT | 0_RDWR, 0644, dbtype, NULL); 
if (db == NULL) { 

perror( "dbopen" ) ; 

exi t(EXIT_FAI LURE); 

} 

fprintf (stdout, " [commande]> "); 
while(fgets(saisie, 128, stdin) ! = NULL) { 
if (saisie[strlen(saisie) - 1] == '\n') 

saisie[strlen(saisie) - 1] = '\0'; 
if (strcasecmptsaisie, "get") == 0) 

traite_get(db) ; 
else if (strcasecmp(saisie, "put") == 0) 

traite_put(db) ; 
else if (strcasecmp(saisie, "del") == 0) 

traite_del (db) ; 
else if (strcasecmp(saisie, "seq") == 0) 

traite_seq(db) ; 
else if (strncasecmptsaisie, "quit", 4) == 0) 

break; 

el se 

fprintf (stdout, "Commandes : put, get, del, seq ou quit\n"); 
fprintf (stdout, "[commande]> "); 
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db->close(db); 
return EXIT_SUCCESS; 

} 

void 

traite_get (DB * db) 
{ 

DBT key; 
DBT data; 
char cle[128]; 
char * donnee; 
int retour; 

fprintf (stdout, "[cle]> "); 

if (fgets(cle, 128, stdin) == NULL) { 

fprintf (stdout, "Abandon !\n"); 

return ; 

} 

if (cle[strlen(cle) - 1] == '\n') 
cle[strlen(cle) - 1] = '\0' ; 
key. data = cle; 

key. size = strlen(cle) + 1; /* avec '\0' */ 
retour = db->get(db, & key, & data, 0); 
if (retour < 0) 

perror( "get" ) ; 
if (retour > 0) 

fprintf (stdout, "Non trouve\n"); 
if (retour == 0) { 

donnee = malloc (data . size); 

if (donnee == NULL) { 
perror( "mal 1 oc" ) ; 
return ; 

} 

memcpy(donnee, data . data, data . size); 
fprintf (stdout, "£s\n", donnee); 
f ree(donnee) ; 

} 

} 

void 

traite_put (DB * db) 
( 

DBT key; 
DBT data; 
char cle [128]; 
char donnee [128]; 
int retour; 

fprintf (stdout, "[cle]> "); 
if (fgets(cle, 128, stdin) == NULL) { 
fprintf (stdout, "Abandon !\n"); 
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return; 

} 

if (cle[strlen(cle) - 1] == '\n') 
cle[strlen(cle) - 1] = "\0" ; 

key. data = cle; 

key. size = strlen(cle) + 1; 

fprintf (stdout, "[donnee]> "); 

if (fgetstdonnee, 128, stdin) == NULL) { 
fprintf (stdout, "Abandon !\n"); 
return; 

} 

if (donnee[strl en(donnee) - 1] == '\n') 
donnee[strl en(donnee) - 1] = '\0'; 

data. data = donnee; 

data. size = strl en(donnee) + 1; 

retour = db->put(db, & key, & data, 0); 

if (retour < 0) 
perror( "put" ) ; 

el se 

fprintf (stdout, "0k\n"); 



void 

traite_del (DB * db) 
{ 

DBT key; 
char cle[128]; 
int retour; 

fprintf (stdout, "[cle]> "); 

if (fgetstcle, 128, stdin) == NULL) { 

fprintf (stdout, "Abandon !\n"); 

return; 

} 

if (cle[strlen(cle) - 1] == '\n') 

cle[strlen(cle) - 1] = '\0' ; 
key. data = cle; 
key. size = strlen(cle) + 1; 
retour = db->del(db, & key, 0); 
if (retour < 0) 

perror( "del " ) ; 
if (retour > 0) 

fprintf (stdout, "Non trouveAn"); 
if (retour == 0) 

fprintf (stdout, "0k\n"); 



void 

traite_seq (DB * db) 

{ 

DBT key; 
DBT data; 
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int retour; 

for (retour = db->seq(db, & key, & data, R_FIRST) ; 
retour == 0; 

retour = db->seq(db, & key, & data, R_NEXT) ) 
fprintf (stdout, "%s\n £s\n", 

(char *) key . data, (char *) data . data); 

} 

Ce programme va nous permettre de creer une petite base avec quelques chaines de caracteres 
et de les manipuler. 

$ ./exemple_dbopen villes.btree btree 

[commande]> put 
[cle]> 1 

[donnee]> BOURGES 
Ok 

[commande]> put 
[cle]> 2 

[donnee]> CHERBOURG 
Ok 

[commande]> put 
[cle]> 3 

[donnee]> DIEPPE 
Ok 

[commande]> put 
[cle]> 4 

[donnee]> EPERNAY 
Ok 

[commande]> seq 
BOURGES 

2 

CHERBOURG 

3 

DIEPPE 

4 

EPERNAY 
[commande]> get 
[cle]> 7 
Non trouve 
[commande]> get 
[cle]> 3 
DIEPPE 

[commanded del 

[cle]> 2 

Ok 

[commande]> get 
[cle]> 2 
Non trouve 
[commande]> seq 
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1 

BOURGES 

3 

DIEPPE 

4 

EPERNAY 
[commanded quit 
$ Is -1 villes.btree 

-rw-r--r-- 1 ccb ccb 8192 Feb 16 15:34 villes.btree 
$ 

Conclusion 

Nous n'avons presente ici que le minimum vital pour manipuler les bases de donnees DB 
Berkeley. II existe des fonctions bien plus completes, supportant la notion de transaction et le 
positionnement de curseurs par exemple. On trouvera des renseignements dans la documenta- 
tion disponible sur le site web de Sleepycat Software. 

Avec F etude des bases de donnees, nous achevons une partie consacree a l'ensemble des 
routines permettant de gerer des fichiers, avec des formes tres diverses. Nous allons mainte- 
nant nous interesser pendant quelques chapitres aux donnees proprement dites, en examinant 
les conversions de type, les routines mathematiques et les informations disponibles sur le 
systeme. 
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Types de donnees generiques 

Les types de donnees connus par le compilateur C sous Linux sont les suivants : 

char, short int, int, long int, long long int, float, double, long doubl e et void*. On peut 
y ajouter les variantes unsigned des types entiers, mais elles ont la meme taille que leur equi- 
valent s i gned. Le type long long i nt est une extension par rapport au C Ansi. 

La taille necessaire pour stocker les donnees est determinee a Faide de la fonction sizeof ( ). 
On notera qu'il ne s'agit pas d'une fonction de bibliotheque mais d'un operateur du langage 
C appartenant a la liste de ses mots-cles, au meme titre que for, i f , swi tch. . . 

Voici la taille des donnees generiques sur un PC sous Linux, avec les options standard du 
compilateur : 



Type 




Taille (en octets) 


char 1 


short int 


2 




int 


4 




long int 


4 




long long int 8 


float 


4 




double 8 


long double 


12 




void * 4 
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Pour certains types entiers, les valeurs minimale et maximale sont definies sous forme de 
constantes symboliques dans <1 i mi ts . h>. II y a cette fois une difference entre les types entiers 
signes et non signes. Bien entendu, les types non signes commencent tous a 0. Voici les noms 
des constantes symboliques representant les limites, ainsi que leurs valeurs sur un PC avec un 
processeur 32 bits : 



Type 


Norn limite 


Valeur limite 




signed char 


S C H A R_M I N 


-128 






SCHAR_MAX 


127 




unsigned char 


UCHAR_MAX 


255 




signed short int 


S H RT_M I N 


-32 768 






SHRT_MAX 


32 767 




unsigned short int 


USHRT_MAX 


65 535 




signed int 


INT_MIN 


-2 147 483 648 






INT_MAX 


2 147 483 647 




unsigned int 


UINT_MAX 


4 294 967 295 




signed long int 


L0NG_MIN 


-2 147 483 648 






L0NG_MAX 


2 147 483 647 




unsigned long int 


UL0NG_MAX 


4 249 967 295 





A partir de ces types, la bibliotheque C definit, par typedef ou #def 1 ne , tous les types speci- 
fiques qu'on peut rencontrer, comme si ze_t, ti me_t, etc. Certains d'entre eux sont des struc- 
tures, comme rusage que nous avons vue dans le chapitre 5, ou des unions, comme sigval 
que nous avons rencontree dans le chapitre 8. 

Categories de caracteres 

Les caracteres representent le bloc fondamental sur lequel repose tout le dialogue avec Futili- 
sateur. Un programme peut manipuler en interne des entiers, des reels, ou meme des objets 
structures complexes, mais dans tous les cas les saisies et les affichages se feront par l'inter- 
mediaire de caracteres. II est done normal qu'il existe une quinzaine de fonctions faisant 
partie du C Ansi, permettant de preciser F appartenance d'un caractere a une ou plusieurs 
categories bien definies. Ces fonctions permettent par exemple de s' assurer qu'un caractere 
est bien une majuscule, un chiffre, un symbole affichable, etc. 

Le prototype general de ces routines, declarees dans <ctype . h> , est le suivant : 

int is<TYPE> (int caractere); 

La valeur passee en argument doit correspondre a celle d'une donnee de type char ou a la 
rigueur a la valeur EOF. Ceci permet de traiter directement la sortie d'une routine comme 
getchar( ). 

Une routine de cet ensemble est particulierement precieuse pour analyser le resultat d'une 
fonction de saisie ou pour afficher correctement des donnees binaires, comme nous l'avons 
fait dans le programme exempl e_getchar . c du chapitre 10. 
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Norn Type de caracteres 



i sal num( ) 


Caractere alphanumerique, lettre ou chiffre. 


i sal pha( ) 


Caractere alphabetique. Dans la localisation C par defaut, il s'agit uniquement des lettres A-Z et a-z 
sans accentuation. 


i sasci 1 ( ) 


Caractere appartenant au standard Ascii (compris entre 0 et 127). La table Ascii est rappelee en 
annexe. 


isbl ank( ) 


Caractere blanc, c'est-a-dire un espace ou une tabulation. 


i scntrl ( ) 


Caractere de controle non imprimable. 


isdigitO 


Chiffre decimal. 


i sgraph( ) 


Caractere imprimable ayant un symbole non blanc. 


i si ower( ) 


Lettre minuscule. Dans la localisation C par defaut, les minuscules accentuees ne sont pas compri- 
ses dans cette categorie. 


i sprintt ) 


Caractere imprimable, c'est-a-dire un caractere graphique ou un espace. 


ispunctt ) 


Caractere de ponctuation. Ceci recouvre les caracteres graphiques non alphanumeriques. 


i sspace( ) 


Caractere d'espacement comprenant par exemple les tabulations horizontale et verticale, le saut de 
ligne, le retour chariot ou le saut de page. 


i suppert ) 


Caractere majuscule. 


i sxdigi t( ) 




Chiffre hexadecimal. 




Attention 




Les routines isTYPEC ) comme les trois routines toTYPE( ) , que nous verrons dans la prochaine section, 
peuvent etre implementees - dans d'anciennes bibliotheques C - sous forme de macros definies dans 
<ctype . h>, evaluant plusieurs fois leurs arguments. 



II faut done eviter tout effet de bord, comme dans 

while (i < strlen(saisie)) 

if (! isdigit(saisie[i++])) 
return -1; 

qui risque de ne verifier qu'un caractere sur deux si isdigitO est implemented ainsi : 

#define isdigit(x) ((x >= '0') && (x <= '9')) 
Le programme suivant permet d'examiner les caracteristiques des caracteres saisis en entree. 
exemple_is.c : 

#include <ctype.h> 
#include <locale.h> 
#include <stdio.h> 

void 

affiche_caracteristiques (int c) 
{ 

fprintf (stdout, "%02X : ", (unsigned char) c); 

if (isalnum(c)) fprintf (stdout, "alphanumerique "); 
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if 


(isalpha(c)) 


fprintf (stdout, 


"alphabetique " 


if 


(isascii(c)) 


fprintf (stdout, 


"ascii "); 


if 


(i scntrl (c) ) 


fprintf (stdout, 


"controle "); 


if 


(isdigit(c)) 


fprintf (stdout, 


"chiffre "); 


if 


(isgraph(c)) 


fprintf (stdout, 


"graphique "); 


if 


(islower(c)) 


fprintf (stdout, 


"minuscule "); 


if 


(isprint(c)) 


fprintf (stdout, 


"imprimable "); 


if 


(ispunct(c)) 


fprintf (stdout, 


"ponctuation ") 


if 


(isspace(c)) 


fprintf (stdout, 


"espace "); 


if 


(isupper(c)) 


fprintf (stdout, 


"majuscule "); 


if 


(isxdigit(c)) 


fprintf (stdout, 


"hexadecimal ") 



fprintf (stdout, "\n"); 

} 

int 
main (void) 
{ 

char chaine[128] ; 
int i; 

setlocale(LC_ALL, ""); 
while (fgetstchaine, 128, stdin) != NULL) 
for (i = 0; i < strlen(chaine) ; i ++) 
affiche_caracteristiques(chaine[i]) ; 
return EXIT_SUCCESS; 

} 

Nous allons observer les effets de la localisation sur ces fonctions, en commencant par utiliser 
la localisation par defaut. 

$ unset LC_ALL 
$ unset LANG 
$ ./exemple_is 

az 1 e 

61 : alphanumerique alphabetique ascii graphique minuscule imprimable hexadecimal 
7A : alphanumerique alphabetique ascii graphique minuscule imprimable 
20 : ascii imprimable espace 

31 : alphanumerique ascii chiffre graphique imprimable hexadecimal 
09 : ascii controle espace 
E9 : 

OA : ascii controle espace 
(Controle - D) 

$ 

Nous remarquons que le caractere a (61) est considere comme une lettre mais aussi comme 
un chiffre hexadecimal, ce qui n'est pas le cas de z (7 A). L'espace (20) est imprimable, alors 
que la tabulation (09) entre le 1 et le e est consideree comme un caractere de controle, au 
meme titre que le retour chariot (OA) en fin de saisie. 

Le cas du caractere e (E9) est plus surprenant. Comme on s'y attendait, il n'est pas considere 
comme un caractere Ascii car son code est superieur a 127. II n'est pas vu non plus comme 
une lettre puisque dans la localisation par defaut elles sont toutes dans la table Ascii. Ce qui 
est encore plus etonnant, c'est qu'il n'est meme pas considere comme un caractere imprimable. 
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En fait c'est logique, car la partie superieure de la table des caracteres n'est pas definie si 
aucune localisation n'est choisie. Le code E9 n'est done associe a aucun symbole particulier. 
La correspondance E9 - e est assuree ici uniquement par le terminal. Par contre, si nous defi- 
nissons la localisation correctement, le comportement est different : 

$ export LANG=fr_FR 
$ ./exemple_is 

eaE 

E9 : al phanumerique 
EO : al phanumerique 
CB : al phanumerique 
OA : ascii controle 
(Control e - D) 

$ 

Les caracteres accentues sont a present reconnus non seulement comme des lettres, mais leur 
classification en majuscules et minuscules est egalement correcte. 

Conversion entre categories de caracteres 

Les conversions de caracteres entre differentes categories sont tres limitees. II existe trois 
fonctions permettant de modifier la classe d'un caractere, toasci i ( ), toupper( ) et to1ower( ), 
dont les prototypes sont declares dans <ctype.h> : 

int toascii (int caractere); 
int toupper (int caractere); 
int tolower (int caractere); 

La fonction toasci i ( ) supprime purement et simplement le huitieme bit du caractere transmis 
afin de renvoyer une valeur comprise entre 0 et 127. On comprend bien que le caractere resul- 
tant de cette modification n'a que tres peu de chance d' avoir quelque chose a voir avec la 
lettre originale. En particulier, un caractere accentue comme e n'est pas transforme en e mais 
en un caractere quelconque de la table Ascii - en 1' occurrence i. Ceci explique les modifica- 
tions parfois etranges des textes contenant des caracteres accentues lorsqu'ils franchissent des 
passerelles de courrier electronique mal configurees. 

Les fonctions toupperO et tolowerO permettent respectivement de passer un caractere en 
majuscule et en minuscule. Ces fonctions sont sensibles a la localisation. Ainsi toupper( 'e' ) 
renverra le caractere E dans une localisation f r_FR par exemple. 



Attention 

Dans les bibliotheques C courantes, toupper ( ) ne modifie pas le caractere passe en argument si ce n'est 
pas une minuscule. Mais dans des versions plus anciennes, cette routine renvoyait un caractere errone car 
elle modifiait toujours le sixieme bit de la lettre. Ceci est egalement vrai avec tol ower( ) et les caracteres 
non majuscules. 



On emploie done systematiquement une verification du genre : 

if (isupper(c)) 

c = tolower(c); 



alphabetique graphique 

alphabetique graphique 

alphabetique graphique 
espace 



minuscule imprimable 
minuscule imprimable 
imprimable majuscule 



618 



Programmation systeme en C sous Linux 



ou 

if (islower(c)) 

c = toupper(c) ; 

Conversions de donnees entre differents types 

Les conversions qui nous interessent ici sont celles qui permettent de passer d'une valeur 
numerique entiere ou reelle a une chaine de caracteres, et inversement. Les conversions 
mathematiques entre reels et entiers seront abordees dans le prochain chapitre. 

II est toujours possible d'utiliser sprintfO ou sscanfO pour presenter les resultats d'un 
calcul ou examiner le contenu d'une chaine, comme nous l'avons vu dans le chapitre 10. 
Toutefois, le surcout impose par l'enorme machine que represente sscanf ( ) ne se justifie pas 
lorsqu'on veut juste convertir une chaine de trois caracteres en une valeur numerique 
comprise entre 1 et 100. Si la conversion n'a lieu qu'une seule fois avant un gros calcul et une 
fois apres pour afficher le resultat, mieux vaut probablement employer sscanf ( ) et spri ntf ( ), 
dont on maitrise generalement mieux l'interface. Neanmoins, si on doit convertir a repetition 
les coordonnees de 200 000 points contenues dans des chaines de caracteres alors que l'utili- 
sateur attend le resultat, il est surement preferable d'employer des routines optimisees. 

Pour ce genre d'operation, il existe des fonctions specialisees tres efficaces. Les plus simples 
sont atoiO, atolO, atofO, ainsi que atollO. Declarees dans <stdlib.h>, ces routines 
convertissent les chaines de caracteres passees en arguments dans les types correspondant a 
leurs noms : 

int atoi (const char * chaine); 
long atol (const char * chaine); 
long long atoll (const char * chaine); 
double atof (const char * chaine); 

Le probleme que posent ces routines reside dans l'impossibilite de determiner si une erreur 
s'est produite, comme le montre le programme suivant : 

exemple_atoi.c : 

#include <stdio.h> 
#1nclude <stdlib.h> 

int 
main (void) 
{ 

char chaine[128] ; 

while (fgetstchaine, 128, stdin) != NULL) 

fprintf (stdout, "Lu : %d \n", atoi (chaine) ) ; 
return EXIT_SUCCESS; 

} 

La routine ne permet pas de faire la difference entre 0 et une chaine invalide : 

$ ./exemple_atoi 

4767 

Lu : 4767 
-101325 
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Lu : -101325 

-2147483648 

Lu : -2147483648 

-2147483649 

Lu : -2147483648 

-2200000000 

Lu : -2147483648 

0 

Lu : 0 
azerty 
Lu : 0 
(Controle-D) 

$ 

On remarque que la fonction plafonne les valeurs a la limite du type de donnees correspon- 
dant. Toutefois, le fait de ne pas pouvoir detecter des situations d'erreur est tres dangereux, 
aussi evitera-t-on au maximum d'employer ces routines, a moins d'avoir auparavant verifie 
entierement le contenu de la chaine. 

II est souvent preferable de se tourner vers les fonctions strtol ( ), strtoul ( ), strtol 1 ( ) et 
strtoul 1 ( ) , declarees dans <stdl i b . h> : 

long int strtol (const char * chaine, char ** fin, int base); 

unsigned long int strtoul (const char * chaine, char ** fin, int base); 

long long int strtoll (const char * chaine, char ** fin, int base); 

unsigned long long strtoull (const char * chaine, char ** fin, int base); 

Ces fonctions analysent la chaine de caracteres passee en premier argument et en extraient 
une variable entiere qu'elles retournent. Le second argument, s'il n'est pas nul, est un poin- 
teur qui est mis a jour pour etre dirige vers le premier caractere non utilise par la conversion. 
Finalement, le dernier argument represente la base employee pour la lecture. La base peut 
s'etendre de 2 a 36 ou prendre la valeur speciale 0. Alors, la lecture est effectuee en base 10, 
sauf si la chaine commence par Ox, cas ou la conversion sera en hexadecimal, ou par un 0, cas 
oil la lecture se fera en octal. 

Pour les bases superieures a 10, on emploie les lettres dans l'ordre alphabetique pour 
completer les chiffres manquants. Ainsi, on utilise A, B, C, D, E et F en hexadecimal, et toutes 
les lettres jusqu'a Z en base 36. II n'y a pas de differences entre les majuscules et les minus- 
cules. Tous les caracteres d'espacement en debut de chaine sont ignores. 

Le pointeur fourni en second argument permet de savoir si la conversion a pu avoir lieu. En 
effet, si aucun chiffre n'est lu, *fin est egal a chaine. En cas de debordement superieur ou 
inferieur, la valeur renvoyee est plafonnee a la limite maximale ou superieure du type de 
donnee, et errno vaut ERANGE. Voici un exemple d'utilisation de strtol ( ). 

exemple_strtol.c : 

#include <errno.h> 
#include <limits.h> 
#include <stdio.h> 
^include <stdlib.h> 



int 
main (void) 
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{ 

char chaine[128]; 
char * fin; 
long retour; 
fprintf (stdout, "> "); 

while (fgetstchaine, 128, stdin) != NULL) { 
retour = strtol (chaine, & fin, 0); 
if (fin == chaine) { 

fprintf (stdout, " Erreur \n> "); 
continue; 

} 

if (((retour == L0NG_MAX) || (retour == L0NG_MIN) ) 
&& (errno == ERANGE) ) { 

fprintf (stdout, " Debordement ! \n> "); 
continue; 

} 

fprintf (stdout, " Lu : £ld \n> ", retour); 

} 

return EXIT_SUCCESS; 

} 

Nous pouvons observer que, cette fois, la detection d' erreur est parfaitement geree : 

$ ./exemple_strtol 

> OxFFFF 

Lu : 65535 

> -2147483648 

Lu : -2147483648 

> -2147483649 
Debordement ! 

> 99999999999 
Debordement ! 

> azerty 
Erreur 

> 0 

Lu : 0 

> (Contr81e-D) 
$ 

Pour lire des valeurs reelles, il existe trois fonctions strtod( ) , strtof ( ) et strtol d( ). 

float strtof (const char * chaine, char ** fin); 

double strtod (const char * chaine, char ** fin); 
long double strtold (const char * chaine, char ** fin); 

Ces routines fonctionnent comme leurs consceurs entieres, a la difference qu'il n'y a pas de 
notion de base ici, toutes les representations etant considerees comme decimales. De plus, les 
routines de conversion de reels sont sensibles a la localisation pour tout ce qui concerne le 
separateur decimal. Dans l'exemple precedent nous n'avons pas utilise la possibilite de lire 
successivement plusieurs valeurs au sein de la meme chaine. Dans le programme suivant nous 
allons nous y employer. 
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exemple_strtof.c : 

#define _GNU_SOURCE 

#include <errno.h> 
#include <limits.h> 
#include <locale.h> 
#include <stdio.h> 
#include <stdlib.h> 

int 
main (void) 

{ 

char chaine[128]; 
char * debut; 
char * fin; 
float retour; 

setlocale(LC_ALL, ""); 

while (fgetstchaine, 128, stdin) ! = NULL) { 
if (chaine[strlen(chaine) - 1] == '\n') 

chaine[strlen(chaine) - 1] = '\0'; 
for (fin = debut = chaine; * fin != '\0'; debut = fin) { 
errno = 0; 

retour = strtof (debut, & fin); 
if (fin == debut) { 

fprintf (stdout, "Erreur \n"); 

break; 

} 

if (errno == E RANGE) 

fprintf (stdout, "Debordement ! \n"); 

else 

fprintf (stdout, "Lu : %f \n", retour); 




return EXIT_SUCCESS; 

} 

Commencons par verifier le comportement vis-a-vis de la localisation : 

$ unset LC_ALL 

$ unset LANG 

$ ./exemple_strtof 

1.5 

Lu : 1.500000 
1,8 

Lu : 1.000000 
Erreur 

$ export LC_ALL=f r_FR 
$ ./exemple_strtof 

1.5 

Lu : 1,000000 
Erreur 
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1,8 

Lu : 1,800000 
(Controle-D) 

$ 

Nous observons au passage que printf ( ) est egalement sensible a la localisation pour ce qui 
concerne l'affichage de la valeur reelle. A present, verifions le probleme du debordement : 

$ ./exemple_strtof 

9999999999 

Lu : 10000000000,000000 
lelO 

Lu : 10000000000,000000 
le20 

Lu : 100000002004087734272,000000 
le30 

Lu : 1000000015047466219876688855040,000000 
le40 

Debordement ! 
Ie39 

Debordement ! 
Ie38 

Lu : 99999996802856924650656260769173209088,000000 
(Controle-D) 

$ 

Nous constatons par la meme occasion que la precision d'une variable f 1 oat est assez limitee. 
Nous pouvons aussi examiner le fonctionnement des lectures successives dans la meme 
chaine : 

$ ./exemple_strtof 

04 07 67 



Lu 


4,000000 


Lu 


7,000000 


Lu 


67,000000 


30 07 68 azerty 


Lu 


30,000000 


Lu 


7,000000 


Lu 


68,000000 


Erreur 


$ 





Parallelement a ces fonctions de lecture de chaine, il existe des routines specialisees dans la 
conversion de variables reelles en chaines de caracteres. Etant peu portables et compliquees a 
utiliser, on les deconseille en general. II est souvent preferable d' employer sprintf ( ). 

Les routines ecvtO, fcvtO et gcvtO sont heritees de Systeme V. Leurs prototypes sont 
declares dans <stdlib.h> ainsi : 

char * ecvt (double nombre, size_t nb_chiffres, 

int * position_point, int * signe); 

char * fcvt (double nombre, size_t nb_chiffres, 

int * position_point, int * signe); 

char * gcvt (double nombre, size_t nb_chiffres, 

char * buffer) ; 
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La fonction ecvt ( ) convertit la valeur passee en premier argument en une chame de caracteres 
contenant au maximum le nombre de chiffres indique en second argument. La chaine 
renvoyee est allouee dans la memoire statique - ecrasee a chaque appel - et ne comprend pas 
de point decimal. En contrepartie, le troisieme argument comportera en retour la position du 
premier chiffre apres ce point decimal. Enfin, le dernier argument sera rempli avec une valeur 
nulle si le chiffre est positif. 

La routine f cvt( ) fonctionne de la meme maniere, mais le second argument indique le nombre 
de decimales desirees. 

La fonction gcvt() ecrit le nombre de chiffres significatifs indique en second argument dans 
le buffer qui est passe en troisieme argument, et renvoie un pointeur sur celui-ci. 

Lutilisation de ecvt( ) et f cvt( ) est loin d'etre intuitive. En voici un exemple : 

#include <stdio.h> 
#include <stdlib.h> 

int 

main (int argc, char * argv[]) 

{ 

double valeur; 
int nb_chiffres; 
int position; 
int signe; 
char * retour; 

if ((argc != 3) 
|| (sscanf(argv[l], "Elf", & valeur) != 1) 
jj (sscanf(argv[2], "%d" , & nb_chiffres) != 1) ) { 

fprintf (stderr, "Syntaxe : %s valeur nb_chiffres \n", 

argv[0]); 

exi t( EXIT_FAI LURE) ; 

} 

retour = ecvttvaleur, nb_chiffres, & position, & signe); 
fprintf (stdout, "ecvtO = %s \n", retour); 
fprintf (stdout, " position = %d \n", position); 
fprintf (stdout, " signe = Id \n", signe); 

retour = fcvttvaleur, nb_chiffres, & position, & signe); 
fprintf (stdout, "fcvtO = %s \n", retour); 
fprintf (stdout, " position = %d \n", position); 
fprintf (stdout, " signe = Id \n", signe); 

return EXIT_SUCCESS; 

} 

Les executions suivantes montrent bien que prevoir le resultat de ces routines necessite une 
bonne dose de concentration : 

$ ./exemple_ecvt 100 3 

ecvtO = 100 
position = 3 
signe = 0 
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fcvtO = 100000 

position = 3 

signe = 0 
$ ./exemple_ecvt 100 2 
ecvtO = 10 

position = 3 

signe = 0 
fcvtO = 10000 

position = 3 

signe = 0 
$ ./exemple_ecvt 1.5 3 
ecvtO = 150 

position = 1 

signe = 0 
fcvtO = 1500 

position = 1 

signe = 0 
$ ./exemple_ecvt -1.5 2 
ecvtO = 15 

position = 1 

signe = 1 
fcvtO = 150 

position = 1 

signe = 1 

$ 

La bibliotheque Gnu ajoute en extensions les fonctions qecvt( ), qf cvt( ) et qgcvt( ) , qui ont 
un comportement similaire mais en utilisant des valeurs 1 ong doubl e (quad). 

char * qecvt (long double nombre, size_t nb_chiffres, 

int * position_point, int * signe); 
char * qfcvt (long double nombre, size_t nb_chiffres, 

int * position_point, int * signe); 
char * qgcvt (long double nombre, size_t nb_chi ffres , char * buffer); 

Enfin, toutes ces fonctions renvoyant leurs valeurs dans des zones de memoire statique, elles 
ne sont pas utilisables dans un contexte multithread. II existe done quatre autres extensions 
Gnu, ecvt_r( ), f cvt_r( ), qecvt_r( ) et qf cvt_r( ) , auxquelles on transmet un buffer person- 
nel a remplir en indiquant sa taille maximale. 

char * ecvt_r (double nombre, size_t nb_chiffres, 

int * position_point, int * signe, 

char * buffer, size_t longueur); 
char * fcvt_r (double nombre, size_t nb_chiffres, 

int * position_point, int * signe, 

char * buffer, size_t longueur); 
char * qecvt_r (long double nombre, size_t nb_chi ffres, 

int * position_point, int * signe, 

char * buffer, size_t longueur); 
char * qfcvt_r (long double nombre, size_t nb_chi ffres, 

int * position_point, int * signe, 

char * buffer, size_t longueur); 
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Les routines gcvtO et qgcvtO emploient deja un buffer transmis par l'application et ne 
necessitent done pas d'equivalentes reentrantes. Rappelons que ces fonctions sont difficiles a 
employer et qu'il vaut generalement mieux se tourner vers sprintfO qui peut offrir les 
memes resultats. Pour cette raison, d'ailleurs, ecvt( ), fcvt( ) et gcvt( ) ont ete supprimees du 
standard ISO C9X. 



Caracteres etendus 

L'internationalisation des programmes est devenue, principalement depuis le developpement 
exponentiel des acces Internet, une priorite pour de nombreux developpeurs. Les applications 
sont longtemps restees cantonnees dans l'emploi de jeux de caracteres limites, tels que l'Ascii 
ou ses extensions ISO (comme les ensembles ISO 8859-1 et ISO 8859-15 presentes en 
annexe). Toutefois, il existe de nombreuses langues dont F alphabet ne peut pas tenir sur une 
table de 255 caracteres. Pour resoudre ce probleme, on a introduit le principe des caracteres 
larges de type wchar_t (wide characters). Ceux-ci suivent les normes de representation ISO- 
10646 et son sous-ensemble Unicode, qui regroupent quasiment Fensemble des alphabets 
connus. 

Une application manipulant des chaines composees de caracteres larges offre une garantie de 
portabilite au niveau des textes traites. Le type wchar_t peut etre compare au char original, 
etendu sur un nombre plus important de bits (31 en general). 

Pour offrir une symetrie parfaite avec les fonctions manipulant des caracteres normaux, il 
existe un type wint_t, capable de recevoir n'importe quel caractere large, ainsi que la constante 
particuliere WEOF. 

Deux constantes symboliques, definies dans <wchar.h>, permettent de connaitre les limites 
des objets de type wchar_t : WCHAR_MIN et WCHAR_MAX. 

Pour indiquer au compilateur qu'une constante doit etre considered comme un caractere 
large, on utilise le prefixe L. Ainsi on ecrira : 

wchar_t chaine [127] ; 
chaine [0] = L'\0' ; 

ou 

if (reponse_saisie [0] == L'N') || (reponse_saisie [0] == L'n") 
return (-1); 

Naturellement, de nouvelles fonctions doivent etre introduites pour offrir les memes possibi- 
lites de manipulation des caracteres et des chaines larges que celles dont nous disposions deja 
avec les caracteres simples. Les fonctions de manipulation des chaines de caracteres larges 
sont declarees dans <wchar.h>, en remplacant simplement les chaines char * en wchar_t *. 
Un caractere nul large L ' \0 ' sert a indiquer la fin de la chaine. 





Fonction avec chaines larges 


Fonction equivalente avec chaines simples 


wcsl en 


(wchar_t * chaine) ; 


strl en 


(char * chaine) ; 


wcsnlen 


(wchar_t * chaine. 


strnl en 


(char * chaine. 




size_t * maximum) ; 




size_t maximum) ; 


wesepy 


(wchar_t * cible. 


strcpy 


(char * cible. 




wchar_t * source) ; 




char * source) ; 
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Fonction avec chaines larges Fonction equivalence avec chaines simples 



wcsncpy 


(wchar_t 




ci bl e , 


strncpy 


(char 




ci bl e , 




HL 1 1 □ 1 L 


* 


o u u 1 Ic , 








o U U 1 Lc , 




size_t 




taille); 




si ze_ 


_t 


taille); 


WtoCd L 


f yrha r t 






j Li Ld L 


'char 


* 










b U U 1 LcJ , 






* 


C (111 KTQ 1 • 


wcsncat 


(wchar_t 




ci bl e , 


strncat 


(char 




ci bl e , 




wchar_t 


* 


source, 




char 


* 


source. 




size_t 




taille); 




size. 


_t 


taille); 


wcscmp 


(wchar_t 




chaine_l. 


strcmp 


(char 




chaine_l , 




wchar_t 




chaine_2) ; 




char 


* 


chaine_2) ; 


wcsncmp 


(wchar_t 




chaine_l. 


strncmp 


(char 


* 


chaine_l , 




wchar_t 


* 


chaine_2. 




char 




chaine_2. 




size_t 




taille); 




size. 


_t 


taille); 


wcscasecmp (wchar_t * chaine_l. 


strcasecmp (char * chaine_l. 




wchar_t * chaine_2); 




char * chaine_2) ; 


wcsncasecmp (wchar_1 


. * chaine_l. 


strncasecmp (char * chaine_l. 




wchar_t * chaine_2. 




char * chaine_2. 




size. 


t 


taille); 




size_t taille); 


wcscol 1 


(wchar_t 


* 


chaine_l. 


strcol 1 


(char 


* 


chaine_l , 




wchar_t 




chaine_2) ; 




char 


* 


chaine_2) ; 


wcsxfrm 


(wchar_t 


* 


chaine_l. 


strxf rm 


(char 


* 


chaine_l , 




wchar_t 




chaine_2. 




char 




chaine_2. 




size_t 




taille); 




size. 


_t 


taille); 


wcschr 


(wchar_t 


* 


chaine. 


strchr 


(char 


* 


chaine. 




wchar_t 




caractere) ; 




char 




caractere) ; 


wcsrchr 


(wchar_t 


* 


chaine. 


strrchr 


(char 


* 


chaine, 




wchar_t 




caractere) ; 




char 




caractere) ; 


wcscspn 


(wchar_t 


* 


chaine. 


strcspn 


(char 


* 


chaine, 




wchar_t 




ensembl e) ; 




char 




ensembl e) ; 


wcsspn 


(wchar_t 




chaine. 


strspn 


(char 


* 


chaine. 




wchar_t 




ensembl e) ; 




char 


* 


ensembl e) ; 


wcspbrk 


(wchar_t 




chaine. 


strpbrk 


(char 




chaine. 




wchar_t 


* 


ensembl e) ; 




char 


* 


ensembl e) ; 


wcsstr 


(wchar_t 


* 


chaine. 


strstr 


(char 


* 


chaine, 




wchar_t 




sous_chaine) ; 




char 


* 


sous_chaine) ; 


wcstok 


(wchar_t 


* 


chaine. 


strtok 


(char 


* 


chaine, 




wchar_t 


* 


separateurs , 




char 




separateurs , 




wchar_t 


** pointeur) ; 




char 


** pointeur); 


wmemchr 


(wchar_t 


* 


chaine. 


memchr 


(char 


* 


chaine, 




wchar_t 




caractere. 




char 




caractere, 




size_t 




taille); 




size. 


_t 


taille); 
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Fonction avec chaines larges Fonction equivalente avec chaines simples 



wmemset 


(wchar_t 
wchar_t 
size_t 




chaine, 

caractere, 

taille); 


memset 


(char * 
char 
size_t 


chaine, 
caractere , 
taille); 




wmemcmp 


(wchar_t 
wcha r_t 
size_t 




chaine_l, 
chaine_2, 
taille); 


memcmp 


(char * 
char * 
size_t 


chaine_l, 
chaine_2, 
taille); 




wmemcpy 


(wchar_t 
wchar_t 
si ze_t 


* 


chai ne_l , 
chaine_2, 
taille); 


memcpy 


(char * 
char * 
si ze_t 


chai ne_l , 
chaine_2, 
taille); 




wmemmove 


(wchar_t 
wchar_t 
si ze_t 


* 


chaine_l, 
chaine_2, 
taille); 


memmove 


(char * 
char * 
size_t 


chaine_l, 
chaine_2, 
taille); 




wcstod 


(wchar_t 
wchar_t 




chaine, 
fin) 


strtod 


(char * 
char ** 


chaine, 
fin); 




wcstof 


(wchar_t 
wchar_t 




chaine, 
fin); 


strtof 


(char * 
char ** 


chaine, 
fin); 




wcstol 


(wchar_t 
wchar_t 
i nt 




chaine, 
fin, 
base) ; 


strtol 


(char * chaine, 
char ** fin, 
int base) ; 




wcstol d 


(wchar_t 
wchar_t 




chai ne , 
fin); 


strto I d 


(char * 
char ** 


chaine, 
fin); 




wcstol 1 


(wchar_t 
wchar_t 
i nt 




chaine, 
fin, 
base) ; 


strtol 1 


(char * chaine, 
char ** fin, 
int base); 




wcstoul 


(wchar_t 
wchar_t 
i nt 




chaine, 
fin, 
base) ; 


strtoul 


(char * chaine, 
char ** fin, 
int base); 




wcstoul 1 


(wchar_t 
wchar_t 
i nt 




chaine, 
fin, 
base) ; 


strtoul 1 


(char * chaine, 
char ** fin, 
int base); 





Nous voyons que les noms des fonctions remplacent le prefixe str (string) par wcs (wide char 
string), mais que les possibilites restent les memes. 

Pour manipuler des caracteres larges seuls, on peut utiliser des routines equivalentes a celles 
que nous avons rencontrees au debut de ce chapitre, declarees dans <wctype.h> : 



Fonction avec caractere large Fonction equivalente avec caractere simple 



i swal num 


(wint_ 


_t 


caractere) ; 


i s a 1 n um 


(int 


caractere) ; 




i swal pha 


(wint_ 


_t 


caractere) ; 


i sal pha 


(int 


caractere) ; 




i swbl ank 


(wint_ 


_t 


caractere) ; 


i sbl ank 


(int 


caractere) ; 




i swcntrl 

1 


(wint_ 


_t 


caractere) ; 


i scntrl 


(int 


caractere) ; 
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Fonction avec caractere large 


Fonction equivalente avec caractere simple 


iswdigit 


( wi n t_ 


4- 


caractere) ; 


i s d i g i t 


\ 1 nt 


ca ractere ) ; 


i swgraph 


( wi n t_ 


+ 
_ I 


caractere) ; 


i s g r a p h 


( in + 
\ \I\L 


ca ractere ) ; 


i swl ower 


( wi n t_ 


4- 
I 


caractere) ; 


i s 1 owe r 




ca ractere ) ; 


iswprint 


( wi n t 


t 


caractere) * 


i s p r i n t 


(int 


ca ractere ) ■ 


1 swpunct 


(wi nt_ 


_t 


caractere) ; 


ispunct 


(int 


caractere) ; 


i swspace 


(wi nt_ 


_t 


caractere) ; 


isspace 


(int 


caractere) ; 


i swupper 


(wi nt_ 


_t 


caractere) ; 


i supper 


(int 


caractere) ; 


iswxdigit 


(wint_ 


_t 


caractere) ; 


isxdigit 


(int 


caractere) ; 


towl ower 


(wint_ 


_t 


caractere) ; 


tol ower 


(int 


caractere) ; 


towupper 


(wi nt_ 


_t 


caractere) ; 


toupper 


(int 


caractere) ; 



Enfin, pour pouvoir assurer des entrees-sorties employant des chaines de caracteres larges, on 
ajoute quelques specifications de type aux formats employes par pri ntf ( ) et scanf ( ) : 



Conversion Signification 

%C Caractere large : pri ntf ( ) attend un argument de type wchar_t, alors que scanf ( ) necessite un 

pointeur sur un caractere large. 

%S Chaine de caracteres larges : pri ntf ( ) comme scanf ( ) demandent un argument de type wchar_ 

t *. 



Nous voyons qu'une application peut done aisement manipuler des caracteres larges, permet- 
tant de disposer d'une ouverture vers l'ensemble des alphabets du globe. 

Les routines specifiques sont definies dans <wchar.h> : 



Nouvelle routine caracteres larges 


Routine equivalente caracteres simples 


wint_t fgetwc 


(FILE * flux); 


int fgetc 


(FILE * flux); 


wint_t getwc 


(FILE * flux); 


int getc 


(FILE * flux); 


wint_t getwchar(void) 




int getchar(void) 


wchar_t * fgetws(wchar_t 


* chaine. 


char * fgets (char * chaine. 




size_t 


taille. 




size_t taille, 




FILE * 


flux); 




FILE * flux); 


wint_t fputwc 


(wchar_t 


caractere. 


int fputc 


(char caractere. 




FILE * 


flux); 




FILE * flux); 


wint_t putwc 


(wchar_t 


caractere. 


int putc 


(char caractere. 




FILE * 


flux); 




FILE * flux); 


wint_t putwchar(wchar_t 


caractere) 


int putchartchar caractere) 


wint_t fputws 


(wchar_t * 


chaine, 


int fputs 


(char * chaine. 





FILE * 


flux); 




FILE * flux); 
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Nouvelle routine caracteres larges Routine equivalente caracteres simples 

wint_t ungetwc (wint_t caractere, int ungetc (int caractere, 

FILE * flux); FILE * flux); 



int 


wpri ntf 


(wchar_t 
. . . ) ; 


* 


format , 


int 


printf 


(char * format, 
. . . ) ; 




int 


fwprintf 


(FILE * 




flux. 


int 


fprintf 


(FILE * flux. 








wchar_t 
. . . ) ; 




format. 






char * format, 
. . . ) ; 




int 


swprintf 


(wchar_t 




cible, 


int 


sprintf 


(char * cible. 








size_t 




maximum, 






size_t maximum. 








wchar_t 
. . . ) ; 




format. 






char * format, 
. . . ) ; 




int 


vwpri ntf 


(wchar_t 


* 


format , 


int 


vprintf 


(char * format. 








va_l i st 




args) ; 






va_list args); 




int 


vfwprintf 


(FILE * 




flux. 


int 


vfprintf 


(FILE * flux. 








wchar_t 




format. 






char * format. 








va_l ist 




args) ; 






va_list args); 




int 


vswprintf 


(wchar_t 


* 


cible. 


int 


vsprintf 


(wchar_t * cible, 








size_t 




maximum, 






size_t maximum. 








wchar_t 


* 


format. 






char * format. 








va_l i st 




args) ; 






va_list args); 




int 


wscanf 


(wchar_t 
. . . ) ; 


* 


format , 


int 


scanf 


(char * format, 
. . . ) ; 





int 


fwscanf 


(FILE * 




flux. 


int 


fscanf 


(FILE * flux. 








wchar_t 
. . . ) ; 


* 


format. 






char * format, 
. . . ) ; 




int 


swscanf 


(wchar_t 


* 


cible. 


int 


sscanf 


(char * cible. 








size_t 




maximum, 






size_t maximum. 








wchar_t 
. . . ) ; 


* 


format. 






char * format, 
. . . ); 




int 


vwscanf 


(wchar_t 


* 


format , 


int 


vscanf 


(char * format. 








va_l ist 




args) ; 






va_list args); 




int 


vfwscanf 


(FILE * 




flux. 


int 


vfscanf 


(FILE * flux. 








wchar_t 


* 


format. 






char * format. 








va_l ist 




args) ; 






va_list args); 




int 


vswscanf 


(wchar_t 


* 


contenu. 


int 


vsscanf 


(char * contenu. 








size_t 




maximum, 






size_t maximum. 








wchar_t 




format. 






char * format. 








va_l ist 




args) ; 






va_list args); 
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Caracteres etendus et sequences multioctets 

Une application peut done manipuler, nous l'avons vu, des chaines de caracteres larges en 
interne, et l'interface avec Futilisateur est egalement definie, meme si elle n'est pas totale- 
ment implementee sous Linux. Toutefois, un probleme se pose pour l'echange de donnees 
entre applications differentes. 

Non seulement la representation interne des caracteres larges est theoriquement opaque, mais 
meme lorsqu'on la connait, elle est dependante par exemple de Fordre des octets sur la machine. 
Pour transferer des donnees entre applications et entre systemes differents, on emploie une 
autre representation : les sequences multioctets. 

Dans ce cadre, les caracteres sont manipules comme des chaines d'octets dont la taille peut 
varier suivant le caractere considered Le standard UTF-8 qui est employe sous Linux pour 
l'encodage des caracteres en sequence multioctet est tres econome. Les caracteres Ascii 
classiques (inferieurs a 128) sont represented par un seul octet. Les caracteres UCS inferieurs 
a 2 048 tiennent sur deux octets, et ainsi de suite jusqu'a un maximum de 6 octets pour 
couvrir tout Fespace UCS de 31 bits. Les caracteres les plus employes dans les communica- 
tions internationales conservent done un encombrement minimal. 

De plus, les caracteres n'appartenant pas a la table Ascii sont represented par des sequences 
d'octets compris entre 128 et 253. Un caractere inferieur a 128 ne peut done etre qu'un carac- 
tere Ascii. II n'y a done pas d'ambiguite, on ne risque pas d'introduire involontairement des 
caracteres de controle, des separateurs de chemin comme 7', ni surtout un caractere nul dans 
le corps d'une chaine. Le standard UTF-8 est done directement utilisable au niveau du 
systeme pour representer des chemins d'acces, des noms de machines, etc. 

Cette representation est largement employee, mais elle n'est pas unique. La bibliotheque C 
peut decider d'utiliser des conversions differentes, en fonction de la localisation par exemple, 
et il faut done traiter les sequences multioctets comme des donnees opaques. 

Le nombre maximal d'octets necessaires pour stocker un caractere quelle que soit la localisa- 
tion choisie sur le systeme est disponible dans la constante symbolique MB_LEN_MAX definie 
dans <1 i mi ts . h>. De meme, la variable MB_CUR_MAX - qui n'est pas une constante symbolique 
disponible lors de la compilation - indique le nombre maximal d'octets necessaires pour 
stocker un caractere dans la localisation en cours. 

Les routines que nous allons examiner ici sont declarees dans <stdl ib.hX La fonction 
wctomb( ) - wide char to multi-byte - permet de convertir un caractere large en une sequence 
multioctet, alors que la fonction mbtowc( ) offre la conversion inverse : 

int wctomb (char * destination, wchar_t source); 

int mbtowc (wchar_t * destination, const char * source, size_t taille); 

En fait, il ne faut jamais employer ces routines. II en existe des equivalents avec la lettre r 
inseree avant le to et un argument supplemental en derniere position. Cet argument est de 
type mbstate_t et permet de memoriser le shift state de la sequence multioctet. Cette valeur 
est un indicateur dependant des caracteres precedemment convertis. Elle n'est employee que 
dans certaines representations multioctets, mais peut etre indispensable. II est necessaire de la 
conserver lors de la manipulation successive des caracteres d'une chaine par exemple. 

Pour initialiser un objet de type mbstate_t, il faut employer la fonction memset( ) ainsi : 
mbstate_t etat; 

memset (& etat, 0, sizeof (mbstate_t) ) ; 
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On pourra alors utiliser les routines mbrtowcO et wcrtombO, qui permettent de faire les 
conversions : 

size_t mbrtowc (wchar_t * destination, 

const char * source, size_t taille, 

mbstate_t * etat); 
size_t wcrtomb (char * destination, 

wchar_t source, 

mbstate_t * etat); 

La fonction mbrtowc ( ) remplit le caractere large sur lequel on passe un pointeur en premier 
argument avec le resultat de la lecture de la sequence multioctet passee en second argument. 
On considere au maximum que le nombre d' octets indique en troisieme position. Si la 
sequence est correcte, la fonction renvoie le nombre d'octets utilises pour la conversion. Si la 
sequence debute bien mais que le nombre d'octets transmis est trop court, mbrtowc ( ) renvoie 
-2, et si la sequence est definitivement invalide, elle renvoie — 1. Si la conversion reussit, Fetat 
transmis en dernier argument est mis a jour. 

La routine wcrtombO convertit le caractere large passe en second argument en sequence 
multioctet, qu'elle ecrit dans la chaine transmise en premiere position. Cette chaine doit 
comporter au moins MB_CUR_MAX octets. La conversion n'a lieu que si le caractere large a une 
signification dans la localisation LC_CTYPE en cours. 

Les fonctions btowcO et wctobO ne permettent de convertir qu'un seul octet en caractere 
large, et inversement. En fait, elles ne sont normalement utilisables que sur l'espace Ascii. Si 
le caractere large necessite plusieurs octets pour etre represente, wctobt ) echoue en renvoyant 
EOF. Ces fonctions ne sont pas interessantes, car elles obligent 1' application a determiner si 
un caractere large se represente sur un ou plusieurs octets, ce qui va a l'encontre des concepts 
d'internationalisation. 

wint_t btowc (int caractere); 
int wctob (wint_t caractere); 

Pour calculer la longueur effective d'une sequence multioctet, on peut employer la fonction 
mbrl en( ), qui permet d'examiner une chaine dont la taille est indiquee en second argument et 
en renvoie la longueur jusqu'au caractere nul. Si la chaine mentionnee est incomplete (la 
taille etant insuffisante pour obtenir un caractere multioctet entier), cette fonction renvoie -2. 

size_t mbrlen (const char * chaine, size_t taille, mbstate_t * etat); 

La fonction mbl en( ) ne doit normalement pas etre employee puisqu'elle ne peut pas memo- 
riser l'indicateur shift state de la chaine. 

int mblen (const char * chaine, size_t taille); 

Les routines nominees mbsrtowcsO et wcsrtombsO convertissent des chaines completes en 
sequences multioctets et inversement, ainsi que mbstowcs( ) et wcstombs( ) , qui ne conservent 
pas Fetat shift state. 

size_t mbsrtowcs (wchar_t * destination, 

const char ** chaine, size_t taille, 

mbstate_t * etat) ; 
size_t wcsrtombs (char * destination, 

const wchar_t * *chaine, size_t taille, 

mbstate_t * etat) ; 
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size_t mbstowcs (wchar_t * destination, 

const char * chaine, size_t taille); 
size_t wcstombs (char * destination, 

const wchar_t * chaine, size_t taille); 

Enfin, on peut noter l'existence des extensions Gnu mbsnrtowcs( ) et wcsnrtombs( ) , qui ne 
convertissent qu'une portion de la chaine. 

size_t mbsnrtowcs (wchar_t * destination, 

const char ** chaine, size_t taille, 

size_t maximum, mbstate_t * etat); 
size_t wcsnrtombs (char * destination, 

const wchar_t ** chaine, size_t taille, 

size_t maximum, mbstate_t * etat); 

Conclusion 

Les utilisations des caracteres larges ainsi que les conversions et echanges avec les sequences 
multioctets ne sont pas encore tres repandus. Le support partiel de ces fonctionnalites par la 
bibliotheque C les rend encore un peu difficiles a employer dans des applications importantes. 
On peut toutefois predire qu'il s'agira d'une evolution importante des programmes destines a 
une diffusion internationale, et qu'il est done bon de prevoir le plus tot possible la compatibi- 
lite des applications avec ces standards. On pourra par exemple dans certains cas employer 
systematiquement des variables wchar_t et wint_t a la place de char et int, comme le font 
certaines portions de la GlibC. 
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Linux dispose d'une panoplie de fonctions mathematiques couvrant l'essentiel des besoins 
courants. II existe egalement des bibliotheques scientifiques supplementaires permettant de 
repondre a des problemes precis. On trouve d'ailleurs de nombreuses pages web consacrees 
aux logiciels scientifiques pour Linux. 

Pour des besoins particuliers, on pourra done completer assez aisement les fonctions que nous 
allons decrire ici et qui sont definies par la GlibC. 

Nous etudierons dans ce chapitre les fonctions trigonometriques, hyperboliques, exponen- 
tielles et logarithmiques. Nous verrons egalement des fonctions dont 1' application est assez 
pointue, comme la fonction gamma ou les fonctions de Bessel. Nous examinerons ensuite les 
fonctions permettant de convertir un reel en entier, ainsi que le traitement des signes, les divi- 
sions entieres et les modulo. 

La purpart des fonctions mathematiques pouvant declencher des erreurs, nous etudierons ici 
les moyens de les detecter, ainsi que le traitement des valeurs infinies. Ceci nous conduira 
d'ailleurs a analyser la methode utilisee par la bibliotheque mathematique pour stocker les 
valeurs reelles. 

Finalement, nous observerons un ensemble de generateurs aleatoires, ainsi que les « bonnes » 
manieres de les utiliser. 

L'essentiel des fonctions mathematiques est declare dans <math.h>. Lorsqu'on les utilise, il 
faut indiquer explicitement a l'editeur de lien d'aller chercher les references necessaires dans 
la bibliotheque 1 i bm . so. On ajoute done l'option -1 m sur la ligne de commande de gcc. 

Sous Linux comme avec tout autre systeme d'ailleurs, il faut etre tres prudent lors des compa- 
raisons de nombres reels. Le format utilise pour stocker les valeurs reelles ne permet pas de 
disposer d'une precision absolue. Aussi, si un nombre peut etre calcule de deux manieres 
differentes, il est rare que les resultats coincident, meme s'ils sont mathematiquement egaux 



par definition. A titre d'exemple, nous savons que cos 
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Nous allons calculer 2xcos^^j - 2 , en esperant retomber sur zero. 
exemple_math_1.c : 

#include <math.h> 
//Include <stdio.h> 
//include <stdlib.h> 

int 
main (void) 
( 

double d; 

d = cos(M_PI / 4) * 2.0; 
d = d * d - 2.0; 

fprintf(stdout, "(2 * cos(PI/4)) 2 - 2 = %e \n", d); 
return EXIT_SUCCESS; 

} 

L' execution suivante, vous vous en doutez probablement, ne donne pas le resultat escompte : 

$ ./exemple_math_l 

(2 * cos (PI/4)) 2 - 2 = 2.734358e-16 

Cette experience demontre qu'il ne faut en aucun cas s'attendre a avoir des egalites parfaites 
avec les nombres reels manipules sous forme numerique. Cela signifie que pour comparer 
deux nombres x et y, il ne faut pas utiliser simplement x = y mais tester au contraire leur diffe- 
rence et verifier si elle est suffisamment faible. La premiere approche est de considerer que x 
et y sont egaux si | x- y \ < £, avec £ petit. Toutefois, ceci n'est generalement pas tres perfor- 
mant car la valeur choisie pour e est figee, et un changement d'ordre de grandeur dans les 
unites utilisees pour x et y peut conduire a des resultats aberrants. II est preferable, au prix 
d'une operation supplemental, de decider que x et y sont egaux si | x - y \ < e(x + y). On 
peut dans ce cas fixer e a une valeur assez faible devant 1 (par exemple 0,001), et la compa- 
raison ne sera pas dependante de Fordre de grandeur de x et y. 



Fonctions trigonometriques et assimilees 

Toutes les fonctions trigonometriques courantes sont presentes dans la GlibC. Tous les angles 
consideres sont en radians. Lorsqu'on desire utiliser des valeurs en degres pour l'interfa5age 
avec Futilisateur, la conversion est aisee : 

#define rad_2_deg(X) (X / M_PI * 180.0) 
#define deg_2_rad(X) (X / 180.0 * M_PI) 

La constante M PI est definie par la GlibC dans <math.h>. Si, lors d'un portage de l'applica- 
tion, cette constante n'est pas definie, on peut la creer ainsi 

//define M_PI 3.14159265358979323846264338327 

ou utiliser une variable globale initialisee au demarrage de 1' application 

int PI; 
int 
main (void) 
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PI = acos(-l.O); 
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Figure 24.1 

Elements trigonometriques 
usuels 




cos(x) 



cosinus 

doubl e cos (doubl ex); 

float cosf (float x); 

long double cosl (long double x); 

Le cosinus de x est compris dans Fintervalle [-1,1] . 

cos(O) = 1 cos (^) = 2 C ° S (f) = ^ cos ( IT ) = ~^ 



cosf 3^ = 0 



double sin (double x) ; 
float sinf (float x) ; 
long double sinl (long double x); 

Le sinus de x est compris dans Fintervalle [-1,1]. 

sin(O) = 0 sinf^ = ^ sin^ = 1 sin(jr) = 0 sin ( 3 f) = - 1 
tangente 

doubl e tan (doubl ex); 
float tanf (float x) ; 
long double tanl (long double x); 

La tangente de x tend vers F infini quand x tend vers - , 3 - , 5 - . . . 

2 2 2 



Attention 

Les routines acos( ), asin( ) ou tan( ) par exemple peuvent echouer si leur argument n'est pas dans le 
domaine de definition de la fonction mathematique correspondante. Nous preciserons le moyen employe pour 
detecter les erreurs plus loin dans ce chapitre. 



636 



Programmation systeme en C sous Linux 



Fonctions trigonometriques inverses 

• arc cosinus 

doubl e acos (doubl e x) ; 
float acosf (float x) ; 
long double acosl (long double x); 

L'arc cosinus de x est Tangle compris dans [0, 7i], dont le cosinus est x. L' argument x doit 
etre obligatoirement dans [-1, 1], sous peine de declencher une erreur EDOM. 



arc cos (-1) = ji arc cos (0) = 



arccos(l) = 0 



double asin (double x) ; 

f 1 oat asi nf (f 1 oat x) ; 

long double asinl (long double x); 

L'arc sinus de x est Tangle dans Tintervalle 



Jl Jl 

~2' 2. 



, dont le sinus est egal a x. Ce dernier 



doit etre obligatoirement dans Tintervalle [-1, 1]. 



Jl Jl 

arcsin(-l) = -- arcsin(O) = 0 arcsin(l) = - 
arc tangente 

doubl e atan (doubl e x) ; 
float atanf (float x) ; 
long double atanl (long double x); 



L'arc tangente de x est Tangle compris dans 



ji ji 
~2' 2. 



dont la tangente est egale ax. 



L'argument x peut prendre n'importe quelle valeur reelle. Plus x tend vers Tinfini, plus son 

arc tangente tend vers - . 
6 2 



Fonctions connexes 

• arc tangente complet 

double atan2 (double x, double y); 
float atan2f (float x, float y); 
long double atan21 (long double x, long double y); 

Cette fonction calcule Tangle dont la tangente est egale a - . Pour cela, elle prend en 

x 

compte le signe de chacune des deux variables afin de determiner dans quel quadrant se 
trouve le resultat. L'angle renvoye est situe dans [-71, Tt\. C'est typiquement la fonction 
qu'on doit utiliser lorsqu'on dispose du sinus et du cosinus d'un angle. Les arguments x et 
y ne sont pas obligatoirement dans Tintervalle [-1, 1]. 

atan2 (cos (x), sin (x)) = x 
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• hypotenuse 

II existe une fonction nommee hypotO, tres pratique pour les applications qui doivent 
mesurer des distances entre des points. Son prototype est le suivant : 

double hypot (double x, double y); 
float hypotf (float x, float y); 
long double hypotl (long double x, long double y); 



Elle renvoie la valeur *]x + y , calculee de maniere optimisee. Ceci permet de disposer en 
une seule fonction de la distance entre deux points : 

distance = hypot (point [i].x - point [j] . x, 

point [1] . y - point [j] . y) ; 

Ce genre de calcul est tres frequent par exemple dans les routines de saisie de trace vecto- 
riel, ou la position du clic de la souris est utilisee pour rechercher le polygone le plus 
proche et le selectionner. 

• sinus et cosinus 

Notons egalement la presence d'une extension Gnu nommee sincosO, qui permet de 
disposer en une seule fonction du sinus et du cosinus d'un angle : 

void sincos (double angle, double * sinus, double * cosinus); 
void sincosf (float angle, float * sinus, float * cosinus); 
void sincosl (long double angle, long double * sinus, 

1 ong doubl e * cosinus ) ; 

On lui transmet bien entendu des pointeurs sur les variables qu'on desire remplir. 



Fonctions hyperboliques 

La bibliotheque C de Linux dispose des fonctions hyperboliques suivantes : 
• cosinus hyperbolique 

doubl e cosh (doubl e x) ; 
float coshf (float x) ; 
long double coshl (long double x); 



X -x 

Le cosinus hyperbolique de x est defini comme etant egal a — - — . 
sinus hyperbolique 

double sinh (double x) ; 
f 1 oat si nhf (f 1 oat x) ; 
long double sinhl (long double x); 

X —X 

Le sinus hyperbolique de x est defini comme etant egal a — - — . 
tangente hyperbolique 

doubl e tanhtdoubl ex); 
float tanhf (float x) ; 
long double tanhldong double x); 

sinh ( x} 

La tangente hyperbolique de x est definie comme etant egale a ^—^ . 

cosh(x) 
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argument cosinus hyperbolique 

double acosh (double x); 
float acoshf (float x) ; 
long double acoshl (long double x); 

L' argument cosinus hyperbolique de x est la valeur dont le cosinus hyperbolique est x. Ce 
dernier doit etre superieur ou egal a 1 . 

argument sinus hyperbolique 

double asinh (double x) ; 
float asinhf (float x) ; 
long double asinhl (long double x); 

L' argument sinus hyperbolique de x est la valeur dont le sinus hyperbolique est x. 
argument tangente hyperbolique 

double atanh (double x); 
float atanhf (float x) ; 
long double atanhl (long double x); 

L' argument tangente hyperbolique de x est la valeur dont la tangente hyperbolique estx. 
La valeur absolue de ce dernier doit etre inferieure a 1. Si elle est egale a 1, l'argument 
tangente hyperbolique est infini. 



Fonctions mathematiques 

Chapitre 24 



Figure 24.3 

Fonctions arguments 
hyperboliques 



atanh(x) 



asinh(x) 




asinh(x) 



Exponentielles, logarithmes, puissances et racines 
Fonctions exponentielles 

• exponentielle 

doubl e exp (doubl ex); 
float expf (float x) ; 
long double expl (long double x); 

Cette fonction renvoie e x , e etant le nombre de base des logarithmes neperiens 
2,7182818285... 

• exponentielle moins 1 

double expml (double x); 
float expmlf (float x) ; 
long double expmll (long double x); 

Cette fonction renvoie <? v - 1 . Le calcul est effectue en gardant un maximum de precision, 
meme lorsque x tend vers 0 (done e x vers 1). 

• exponentielle en base 2 

doubl e exp2 (doubl e x) ; 
float exp2f (float x); 
long double exp21 (long double x); 



Cette fonction calcule 2* qui est equivalent a e 



x\a{2) 
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• exponentielle en base 10 

double explO (double x); 
float explOf (float x) ; 
long double explOl (long double x); 

Cette fonction calcule 1CK 



Figure 24.4 

Fonctions exponentielles 
et logarithmes 




Fonctions logarithmiques 

• logarithme neperien 

doubl e 1 og (doubl e x) ; 
float logf (float x); 
long double logl (long double x); 

Cette fonction renvoie le logarithme neperien (naturel) de x, c'est-a-dire la valeur y pour 
laquelle e v = x. L' argument x doit etre strictement positif. 

• logarithme neperien de 1 plus x 

double loglp (double x); 
float loglpf (float x) ; 
long double loglpl (long double x); 

Cette fonction calcule logd + x) en gardant le maximum de precision, meme lorsque x 
tend vers zero, dans ce cas logd + x) tend aussi vers zero. Alors x doit etre strictement 
superieur a -1. 
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• logarithme en base 2 

double log2p (double x); 
float log2pf (float x) ; 
long double log2pl (long double x); 

Cette fonction calcule le logarithme en base 2 de x. Cette valeur est souvent utilisee pour 
connaitre le nombre minimal de bits necessaires pour coder un nombre. 

• logarithme decimal 

doubl e 1 oglO (doubl ex); 
float loglO (float x); 
long double loglO (long double x); 

Cette fonction calcule le logarithme en base 10 de x. Ceci permet de connaitre le nombre 
de chiffres decimaux necessaires pour afficher la partie entiere de x. 



Puissances et racines 

• elevation a la puissance 

double pow (double x, double y); 
float powf (float x, float y); 
long double powl (long double x, long double y); 

Cette fonction renvoie x>\ Si x est negatif et si y n'est pas un entier, x>' devrait etre 
complexe. Dans ce cas, la fonction echoue et renvoie une erreur EDOM. 

• racine carree 

doubl e sqrt (doubl e x) ; 
float sqrtf (float x) ; 
long double sqrtl (long double x); 

La fonction sqrt( ) renvoie la racine carree (square root) de x. Bien entendu, x doit etre 
positif ou nul. 

• racine cubique 

doubl e cbrt (doubl e x) ; 
float cbrtf (float x) ; 
long double cbrtl (long double x); 

Cette fonction renvoie la racine cubique (cube root) de x. II n'y a pas de contraintes sur les 
valeurs de x. 



Nombres complexes 

Depuis la norme C9X, un nouveau type de donnees est disponible pour representer les 
nombres complexes. II faut pour cela inclure l'en-tete <complex.h>. Nous pouvons des lors 
definir des variables de type fl oat complex, double complex, ou long double complex en 
fonction de Fetendue desiree, et utiliser des fonctions specifiques pour les manipuler. 

Nous disposons de la constante symbolique I pour representer le nombre imaginaire pur i tel 
que i 2 = -1. Voici un exemple simple dans lequel nous initialisons un nombre complexe, puis 
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affichons ses divers parametres, calculons son conjugue et affichons les caracteristiques de 
celui-ci : 

exemple complexe : 

#include <complex.h> 
#include <math.h> 
#include <stdio.h> 
#include <stdlib.h> 



int 

main (void) 
{ 



double complex z; 



z = 0.5 + I * (sqrt(3)/2); 



fprintf (stdout, "Z 

fprintf (stdout, " 

fprintf (stdout, " 

fprintf (stdout, " 

fprintf (stdout, " 



: \n"); 

Partie reelle 
Partie imaginaire 
Modul e 
Argument 



%f\n", creal(z)); 

%f\n", cimag(z)); 

%f\n", cabs(z)); 

%f\n", carg(z)); 



conj(z) ; 



fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 
fprintf (stdout, 



\nConjugue de Z 
Partie reelle 
Partie imaginaire 
Modul e 
Argument 



\n") : 

^f\n", creal(z)); 

%f\n", cimag(z)); 

%f\n", cabs(z)); 

%f\n", carg(z)); 



return EXIT SUCCESS; 



} 



L' execution donne : 
$ ./exemple_complexe 



Partie reelle 
Partie imaginaire 
Modul e 
Argument 

Conjugue de Z : 
Partie reelle 
Partie imaginaire 
Modul e 
Argument 



0.500000 
0.866025 
1.000000 
1.047198 



0.500000 
-0.866025 
1.000000 
-1.047198 



La valeur 0.866025 correspond a ^ et 1.047198 a - . 
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Toutes les routines que nous avons vues precedemment sont disponibles dans une forme 
complexe. Les prototypes suivants correspondent aux versions double complex mais il existe 
egalement des fonctions f 1 oat compl ex (avec un suffixe f) et 1 ong doubl e compl ex (avec un 
suffixe 1). 

double complex ccos (double complex z); 

double complex csin (double complex z); 

double complex ctan (double complex z); 

double complex cacos (double complex z); 

double complex casin (double complex z); 

double complex catan (double complex z); 

double complex ccosh (double complex z); 

double complex csinh (double complex z); 

double complex ctanh (double complex z); 

double complex cacosh (double complex z); 

double complex casinh (double complex z); 

double complex catanh (double complex z); 

double complex cexp (double complex z); 

double complex clog (double complex z); 

double complex cpow (double complex zl, double complex z2); 

double complex csqrt (double complex z); 

Le lecteur desirant plus de details sur l'une de ces fonctions pourra se reporter aux pages de 
manuel, ou a la description dans la norme SUSv3. 

Calculs divers 

La bibliotheque GlibC offre quelques fonctions qui ne s'appliquent que dans des cas tres 
particuliers et assez rares. 

Fonctions d'erreur 

• erreur 

doubl e erf (doubl ex); 
float erff (float x) ; 
long double erfl (long double x); 

La fonction d'erreur de x, Erf(x), est utilisee dans le domaine du calcul des probabilites. 
Elle a ete definie par Gauss ainsi : 

2 X -t 2 
erf(x) = — C e dt 

JjzJ 

0 

Cette fonction tend tres vite vers 1, par valeur inferieure lorsque x tend vers +°°. 

• erreur complementaire 

double erfc (double x) 
float erfcf (float x) 
long double erfcl (long double x) 

renvoie l'erreur complementaire definie ainsi : erfc(x) = 1 - erf (x). Le calcul est realise 
en conservant la precision, meme lorsque x est grand. 
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Fonction gamma 



gamma 



double tgamma (double x); 
float tgammaf (float x); 
long double tgamma 1 (long double x); 

tgamma (x) = T(x) 

La fonction gamma est aussi appelee fonction eulerienne de deuxieme espece. 
Sa definition est la suivante : 



o 

Cette fonction a une propriete importante : si n est un entier naturel, alors T(n + 1) = n\. 
La fonction gamma est done une extrapolation de la factorielle sur l'ensemble des reels. 

• logarithms de gamma 

double lgamma (double x); 
float lgammaf (float x); 
long double lgammal (long double x); 

lgamma (jc) = log (T(x)) 

Fonctions de Bessel 

• Bessel de premiere espece 
double jO (double x) ; 



float jOf (float x); 

long double j 01 (long double x); 

double jl (double x) ; 
float jlf (float x); 
long double jll (long double x); 

double jn (int n, double x); 
float jnf (int n, float x); 
long double jnl (int n, long double x); 

Ces trois fonctions sont appelees fonctions de Bessel de premiere espece, respectivement 
d'ordre 0, 1, et n. La definition d'une fonction de Bessel d'ordre n est la suivante : 



On retrouve la fonction gamma, vue plus haut, dans l'expression des fonctions de Bessel. 

Les fonctions de Bessel sont appliquees dans des domaines assez divers, tels que l'electro- 
magnetisme, la thermodynamique, l'acoustique. . . 




■ii- l 



dt 



e t 
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Figure 24.5 

Fonctions de Bessel 
de premiere espece 




• Bessel de seconde espece 

doubl e yO (doubl ex); 
float yOf (float x); 
long double yOl (long double x); 

doubl e yl (doubl ex); 
float ylf (float x); 
long double yll (long double x); 

double yn (int n, double x); 
float ynf (int n, float x); 
long double ynl (int n, long double x); 

Les fonctions de Bessel de seconde espece, d'ordre 0, 1, et n, sont moins utilisees que 
celles de premiere espece. 



Figure 24.6 

Fonctions de Bessel 
de seconde espece 



0,5 y=y0(x) 

/ Y\y=y 1 M 



20 



646 



Programmation systeme en C sous Linux 



Limites d'intervalles 

II est frequent de devoir transformer le resultat de calculs reels en valeurs entieres. Toutefois, 
il y a plusieurs fonctions disponibles, et un mauvais choix peut conduire a des erreurs de 
conversion assez deroutantes. 

La conversion la plus simple est celle qui est implicite lorsqu'on transfere le contenu d'une 
variable reelle dans une variable entiere. Cette conversion consiste simplement a supprimer 
la partie decimale du nombre reel. Ainsi 4,5 devient4, et -3,2 devient-3. Frequemment 
employee, cette methode est pourtant rarement celle qui est voulue en pratique. Dans un affi- 
chage cartographique par exemple, les polygones sont generalement representes par des listes 
de points dont les coordonnees sont reelles. Ainsi, il est possible de realiser des operations de 
zoom, translation ou rotation avec une bonne precision. Toutefois, lors de l'affichage, une 
conversion en valeurs entieres doit avoir lieu pour obtenir les coordonnees des pixels. Si on 
utilise une conversion implicite des variables du langage C, on risque de voir deux polygones 
adjacents mal raccordes par leurs sommets communs. 



Figure 24.7 

Fonctions d'arrondi 



floor(x) 



ceil(x) 



rint(x) 



y 

1 

-1 


(int)x 








X 








1 

-1 







Pour eviter ce probleme, on emploie plutot la fonction rint( ) qui arrondit a l'entier le plus 
proche : 

doubl e ri nt (doubl e x) ; 
float rintf (float x) ; 
long double rintl (long double x); 

On observe alors que rint(4.8)=5, rint(4.2)=4, rint(-3.1)=-3 et ri nt ( -0 . 9 ) = -l 
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Parfois, on peut egalement preferer utiliser la veritable fonction mathematique « partie 
entiere », qui arrondit a l'entier immediatement inferieur ou egal. Cette fonction est nominee 
floorO : 

double floor (double x); 
float floorf (float x) ; 
long double floorl (long double x); 

Cette fois, floord .2)=1, et floor(1.9)=l, mais egalement floor(-0.9)=-l. On notera qu'il 
existe un synonyme de f 1 oor( ) nomme trunc( ). 

Enfin, la fonction ceil () arrondit symetriquement par exces a l'entier immediatement supe- 
rieur : 

doubl e cei 1 (doubl e x) ; 
f 1 oat cei If (f 1 oat x) ; 
long double ceill (long double x); 

Voyons les differences de comportement de ces quatre routines autour de zero. 
exemple_math_2.c : 

#include <math.h> 
#include <stdio.h> 
#include <stdlib.h> 



int 
main (void) 

{ 

double d; 

double arrondi_inf; 
double arrondi_sup; 
double arrondi_proche; 
int converti; 



printfC'reel floorO ceilO rintO (int)\n"); 
for (d = -1.8; d < 1.9; d += 0.2) { 

arrondi_inf = floor(d); 

arrondi_sup = cei 1(d); 

arrondi_proche = rint(d); 

converti = (int) d; 

printf("% 4. If % 4. If % 4. If % 4. If % 2d\n", 
d, arrondi_inf, arrondi_sup, arrondi_proche, converti); 

1 



return EXIT_SUCCESS; 

1 

L' execution correspond a ce qu'on attendait : 
$ . /exemple_math_2 

reel floorO ceilO rintO (int) 
-1.8 -2.0 -1.0 -2.0 -1 
-1.6 -2.0 -1.0 -2.0 -1 
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Valeurs absolues et signes 

II existe plusieurs fonctions permettant d'extraire la valeur absolue d'un nombre, suivant le 
type de donnee utilisee. 

int abs (int n); 

long labs (long n); 

long long 1 1 abs (long long n); 

double fabs (double x) ; 

float fabsf (float x) ; 

long double fabsl (long double x); 

Les trois premieres fonctions travaillent avec des entiers, les trois dernieres avec des reels. 
Pour eviter qu'un programme, qui ne realise que des operations arithmetiques sur des entiers, 
ne soit oblige d'inclure <math . h> et toute la surcharge de code d' emulation mathematique sur 
certains systemes, les fonctions abs(), labsO et llabsO sont declarees dans <stdlib.h> 
depuis la norme C9X. 

La representation d'un entier sur n bits permet de couvrir l'intervalle allant de -2" a 2" - 1. 
Aussi, il n'est pas possible avec abs ( ) ou 1 abs ( ) de calculer la valeur absolue du plus petit 
entier representable dans le type de donnees correspondant. En effet, le debordement nous 
ramene a la meme valeur negative. 

II existe une fonction nommee copysign( ) permettant d'extraire le signe d'un nombre reel de 
maniere efficace. 

double copysign (double valeur, double signe); 
float copysignf (float valeur, float signe); 
long double copysignl (long double valeur, long double signe); 

Cette fonction renvoie un nombre constitue de la valeur absolue de son premier argument et 
du signe du second. Cette fonction est utilisable avec les infinis. 



Fonctions mathematiques 

Chapitre 24 



Divisions entieres, fractions, modulo 

II existe plusieurs fonctions permettant de calculer des divisions entieres. Rappelons que les 
operateurs « / » et « % » du langage C permettent aussi de calculer facilement un quotient et 
un reste. 

• division entiere 



div_t div (int dividende, int diviseur); 

Cette fonction effectue la divisic 
disposant des membres suivants 



Cette fonction effectue la division entiere dividende et renvo j e i e r esultat dans une structure 

diviseur 



Nom 


Type 




Signification 


quot 


Int 


Quotient de la division entiere 




rem 


Int 


Reste de la division entiere 





ldiv_t ldiv (long dividende, long diviseur); 

lldiv_t lldiv (long long dividende, long long diviseur); 

Les fonctions ldiv( ) et 1 ldiv( ) sont calquees sur div( ), simplement elles renvoient leurs 
resultats dans des structures 1 di v_t et 1 1 di v_t, dont les membres (egalement nommes quot 
et rem) sont de type 1 ong pour l'une et 1 ong 1 ong pour l'autre. 

modulo 

double fmod (double dividende, double diviseur); 

float fmodf (float dividende, float diviseur); 

double fmodl (long double dividende, long double diviseur); 

double drem (double dividende, double diviseur); 

Toutes ces fonctions permettent de calculer le reste d'une division entiere mais avec 
des definitions differentes. Les fonctions fmodO renvoient un nombre dont le signe est 
celui du dividende et dont la valeur absolue est dans l'intervalle [0, diviseur], alors que 
dremO qui est une extension BSD non definie par SUSv3, fournit un resultat dans 

diviseur diviseur' 



En fait, toutes renvoient (dividende -nx diviseur), simplement fmod ( ) arrondit n systema- 
tiquement a l'entier inferieur, alors que drem( ) l'arrondit a l'entier le plus proche. 

double modf (double valeur, double * partie_entiere) ; 

float modff (float valeur, float * parti e_enti ere) ; 

long double modfl (long double valeur, long double * parti e_enti ere) ; 

Cette fonction separe la partie decimale et la partie entiere de son premier argument. Elle 
renvoie la partie decimale apres avoir rempli le pointeur passe en second argument avec la 
partie entiere. Par exemple avec : 

double partie_decimale, partie_entiere; 
partie_decimale = modf (7.67, & partie_entiere) ; 
partie_decimale vaudra 0.67 et partie_entiere 7. 
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La partie entiere est calculee en utilisant la conversion implicite de reel en entier, aussi 
pour les valeurs negatives, la partie decimale se trouve dans l'intervalle ]-l, 0]. 

fraction normalisee 

double frexp (double valeur, double exposant); 

float frexpf (float valeur, float exposant); 

long double frexpl (long double valeur, long double exposant); 

Cette fonction sert a decomposer un nombre en virgule flottante en une fraction normalisee, 

"1 



se trouvant dans l'intervalle 



1 



et un exposant. Lorsqu'on multiplie cette fraction 



normalisee par 2 ex P osant , on retrouve la valeur originale. Cette fonction est en fait 1' inverse 
de ldexp( ) presentee ci-dessous. Nous examinerons dans la prochaine section le stockage 
des reels en memoire, ce qui eclairera un peu l'utilite de cette fonction. 

double ldexp (double x, double y); 

float ldexpf (float x, float y); 

long double ldexpl (long double x, long double y); 

Cette fonction renvoie la valeur x ■ 2- v . Ceci sert pour reconstituer un nombre reel a partir de 
sa representation binaire au format IEEE 754. 



Infinis et erreurs 

Les fonctions mathematiques ont des domaines de definition bien precis. Essayer d'invoquer 
une fonction, par exemple log(), pour une valeur interdite (disons -5) doit renvoyer une 
erreur. Toutefois, la routine log() ne peut pas se contenter de renvoyer -1 en cas d'erreur, 
comme le font d'autres fonctions de bibliotheque habituellement. Cette valeur, en effet, est 

tout a fait legitime pour x = - . 

e 

Valeur non numerique 

Pour signaler une erreur, les routines renvoient une valeur speciale, nommee NaN, ce qui 
signifie Not a Number. De plus, elles positionnent la variable globale errno (avec l'erreur 
EDOM en general). Pour verifier le resultat, il existe une fonction nommee isnanO, declaree 
ainsi : 

int isnan (double valeur); 

II s'agit en realite d'une macro, aussi peut-on utiliser la meme routine pour les differents 
types de reels (f 1 oat, doubl e et 1 ong doubl e). 

Elle renvoie 0 si son argument est numerique et une valeur non nulle sinon. On peut done 
employer le code suivant : 

double cosinus ; 
double angle : 



angle = acos(cosinus) 
if (isnan(angle)) { 
perrorCacos") ; 
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exit(EXIT_FAILURE); 



Attention 

II n'existe pas de constante symbolique NaN avec laquelle on pourrait faire la comparaison. Nous verrons 
dans la representation binaire des reels qu'il n'y a pas une unique valeur non numerique, mais qu'on en 
trouve une multitude. 



Infinis 

Parfois une fonction reelle, par exemple f(x) = - , peut renvoyer une valeur infinie sur un 

x 

point precis de son intervalle de definition, en x = 0 en l'occurrence. Comme la precision de 
la representation des reels en virgule flottante est limitee, il existe necessairement une certaine 
zone de « flou » autour de ce point. On ne peut done pas simplement renvoyer une erreur, 
mais la bibliotheque C doit permettre de traitor les infinis. Elle utilise done deux valeurs 
supplementaires speciales, indiquant + °° et - °°. Pour les detecter, il existe une fonction 
isinfO : 

int isinf (double valeur); 

Cette routine renvoie 0 si la valeur est finie, -1 s'il s'agit de - °°, et + 1 s'il s'agit de + °°. 
II existe egalement une routine f1n1te( ) ayant le fonctionnement contraire : 

int finite (double valeur); 

Elle renvoie une valeur non nulle si la valeur transmise est numerique (pas NaN) et finie. Le 
parametre indique ici est de type double mais on utilise les memes routines isinf () et 
finiteC ) quel que soit le type de donnees reelles. 

Voici un exemple qui va nous permettre de voir les divers cas traites par la bibliotheque 
mathematique. 

exemple_math 3.c : 

#define _X0PEN_S0URCE 600 
#include <errno.h> 
#include <math.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 



void 

affiche_nombre (const char * chaine, double d) 

{ 

fprintf (stdout, "%s" , chaine); 
if (isnan(d)) 

fprintf (stdout, "Indefini \n"); 
else if (isinf(d) == 1) 

fprintf (stdout, "+ Infini \n"); 
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else if (isinf(d) == -1) 

fprintf (stdout, "- Infini \n"); 

el se 

fprintf (stdout, "%f \n", d); 

} 

int 
main (void) 
{ 

double d; 

d = +0.0; 
d = 1.0 / d; 

aff i che_nombre( "1 / +0 = ", d); 
d = -0.0; 
d = 1.0 / d; 

aff i che_nombre( "1 / -0 = ", d); 
d = 0.0 / 0.0; 

aff i che_nombre( "0 / 0 = ", d); 
d = log(O.O); 

aff i che_nombre( "1 og(0) = ", d); 
d = log(-l.O); 

affiche_nombre("log(-l)= ", d); 
d = MAXFL0AT; 

affiche_nombre("MAXFL0AT = ", d); 
d = exp(MAXFLOAT); 

affiche_nombre("exp(MAXFLOAT)= ", d); 
return EXIT_SUCCESS; 

} 

Pour des raisons de compatibilite avec les standards precedents, il faut definir la constante 
J(0PEJLS0URCE avec la valeur 600 pour obtenir MAXFL0AT et i sinf ( ). 

Nous remarquons que la bibliotheque distingue +0 de -0, ce qui peut paraitre surprenant a 
premiere vue, mais qui s'explique par la representation des nombres que nous examinerons 
plus bas. 

$ ./exemple_math_3 

1 / +0 = + Infini 
1 / -0 = - Infini 
0 / 0 = Indefini 
log (0) = - Infini 
log (-1)= Indefini 

MAXFL0AT = 340282346638528859811704183484516925440.000000 

exp(MAXFL0AT)= + Infini 

$ 

Si on construit une bibliotheque mathematique complementaire, il peut etre necessaire de 
renvoyer des valeurs infinies ou non numeriques en cas d'erreur. II ne serait pas tres elegant 
d'etre oblige de les obtenir avec des artifices du genre (-1.0 / 0.0) ou log (-1.0). II faut 
done avoir un moyen d'acceder directement a ces valeurs. Les infinis sont represented par HUGE_ 
VAL ou -HUGE_VAL II n'y a pas de constante symbolique permettant de renvoyer directement 
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NaN, mais il existe une routine BSD non definie par SUSv3 pouvant servir a renvoyer une 
erreur. 

double infnan (int erreur); 

Si 1' argument erreur vaut EDOM, infnanO renvoie NaN, s'il vaut ERANGE ou -ERANGE, infnanO 
renvoie respectivement HUGE_VAL ou -HUGE_VAL. 

Representation des reels en virgule flottante 

Pour stocker un reel en memoire, la plupart des ordinateurs utilisent un format normalise, 
connu sous le nom de IEEE 754. Ce format peut done convenir pour transferer des valeurs 
numeriques entre ordinateurs. Toutefois, il est important de savoir eventuellement decoder 
« manuellement » les donnees si le systeme destinataire ne respecte pas le meme format. 

Le format IEEE 754 utilise 32 bits pour les valeurs de type f 1 oat, 64 bits pour les reels de 
type double. Dans les deux cas, le reel est stocke sous forme d'un bit de signe, suivi d'un 
exposant (sur 8 bits dans un cas, et 1 1 bits dans 1' autre), suivi de la fraction normalisee sur 23 
et 52 bits respectivement. 

Figure 24.8 Simple precision "float" 

Representations binaires o 1 8 9 31 



Le format long double est defini par IEEE 854. II s'agit d'un codage sur 12 octets, soit 
96 bits, composes d'un bit de signe, suivi par 15 bits d' exposant, 16 bits vides, puis 64 bits de 
fraction normalisee. 

Le bit de signe vaut 0 si le nombre est positif, et 1 s'il est negatif. Ceci nous explique pour- 
quoi la bibliotheque distingue +0 . 0 et -0 . 0. 

Lexposant est compris entre 0 et 255 pour les f 1 oat, 2 047 pour les reels de type doubl e, ou 
32 767 pour les 1 ong doubl e. 

Si 1' exposant vaut 255 (2 047 ou 32 727) et si la fraction normalisee n'est pas nulle, alors le 
nombre represente NaN. Si l'exposant vaut 255 (2 047 ou 32 767) et si la fraction est nulle, 
le nombre correspond a + °° ou - °° en fonction du bit de signe. On comprend alors qu'il 
existe une grande quantite de valeurs pouvant correspondre a NaN, puisqu'il suffit que la frac- 
tion normalisee ne soit pas nulle. C'est pour cela qu'il n'existe pas de constante symbolique 
NaN avec laquelle on pourrait comparer une valeur. 

Si l'exposant n'est pas nul et s'il n'a pas sa valeur maximale (255, 2 047 ou 32 767), alors le 
nombre represente vaut : 

(_\yigne x 2(e*posant- 127) x (i.O + fraction) pour les reels de type f 1 oat, 
(_1 yigne x 2(ex P o.sant- 1 023) x (j q + fraction) pour les reels de type doubl e, et 
(- 1 x l^posam- 16 383) x q + fraction) pour les long double. 



des nombres reels 




Double precision "double" 

0 1 11 12 63 
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La valeur de la fraction est calculee en additionnant les puissances negatives successives de 2, 

en commencant par - et en se terminant par — = , — — ou — . 

v F 2 F 2 23 8388608 2 52 2 

Par exemple, la fraction normalised 1 1010010 (en se limitant a 8 bits) vaut : 

- + - + 0+ — + 0 + 0+ — + 0 = 0.8203125 . 
2 4 16 128 

Finalement un cas particulier se presente si l'exposant vaut zero. 

Si la fraction est nulle, le nombre correspond a +0 ou -0 en fonction du bit de signe, sinon, la 
valeur est : 

(-\yigne x 2-™ X fraction pourun float, 
(-lyigne x 2-1 022 x f ract i on pour un doubl e, et 

(_ lyigne x 2-16 382 x fr ac f wn p 0ul - un 1 on g d o u b 1 e. 

Si nous avons presente ce format ici, c'est qu'il est largement utilise dans les ordinateurs 
modernes et permet normalement un echange assez facile des donnees. On peut ainsi sur 4, 8, 
ou meme 12 octets, transferer des valeurs reelles avec une tres bonne precision sur un reseau 
ou dans un fichier. La connaissance detaillee des formats IEEE 754 et 854 nous permet de 
conserver dans un tiroir des routines d'encodage et de decodage s'il faut porter une applica- 
tion sur un systeme representant differemment les nombres en virgule flottante. 



Generateurs aleatoires 

II existe trois types de generateurs aleatoires disponibles sous Linux. Lun est offert par le 
noyau, le deuxieme par la bibliotheque C standard, et le troisieme par la bibliotheque mathe- 
matique. Chacun presente des avantages et des inconvenients. 



Generateur aleatoire du noyau 

Linux offre un generateur aleatoire integre, sous forme de deux fichiers speciaux de periphe- 
rique, /dev/random et /dev/urandom. lis doivent etre crees avec les numeros majeurs 1 et 
mineurs 8 et 9 respectivement : 

$ Is -1 /dev/*random 

crw-r--r— 1 root root 1, 8 May 5 1998 /dev/random 

crw-r--r-- 1 root root 1, 9 May 5 1998 /dev/urandom 

$ 

Les caracteres qu'on trouve dans ces pseudo-fichiers sont engendres a partir de sources de 
bruit definies dans les pilotes de peripheriques. Le noyau extrait des donnees aleatoires a 
partir de mesures diverses imprevisibles. Ces caracteres sont disponibles dans le fichier /dev/ 
random. Lorsque le systeme n'a plus de donnees assez bruitees a sa disposition, l'appel 
systeme de lecture sera bloquant. II est assez amusant, sur un systeme au repos, de demander 
un cat < /dev/random et d'observer que l'affichage s'arrete au bout d'un moment, et que le 
noyau retrouve a nouveau des valeurs aleatoires a chaque deplacement de la souris ou action 
sur le clavier. Le fait que l'appel systeme soit bloquant si des donnees vraiment aleatoires ne 
sont plus disponibles peut etre parfaitement adapte dans certains cas (creation de mots de 



Fonctions mathematiques 

Chapitre 24 



passe, cle cryptographique 1 ...) mais tres genant dans d'autres situations (jeux). Pour cela, le 
noyau offre egalement un autre pseudo-fichier, /dev/urandom, dont la lecture n'est jamais 
bloquante, mais dont les valeurs peuvent devenir moins aleatoires lorsqu'il n'y a plus assez de 
donnees bruitees. Le noyau emploie alors un algorithme deterministe, et les caracteres 
obtenus peuvent theoriquement etre devines a Favance ; il est done a eviter dans les applica- 
tions cryptographiques. 

La lecture depuis ces pseudo-fichiers fournit probablement la meilleure moisson de valeurs 
aleatoires, puisque cette methode est la plus proche du generateur ideal qui consisterait a 
numeriser un bruit blanc parfait, fournissant ainsi des donnees totalement imprevisibles. 

Toutefois, cette methode est difficilement portable sur des systemes moins accommodants 
que Linux, aussi est-on parfois oblige de se rabattre sur des generateurs purement numeriques. 

Generateur aleatoire de la bibliotheque C standard 

Un generateur numerique ne peut fournir que des valeurs pseudo-aleatoires. Cela signifie que 
la serie de nombres fournie se repetera necessairement, mais avec une periode tellement 
longue que F observation externe de la sequence, sur un echantillon de taille raisonnable, ne 
permettra pas de predire la valeur suivante. En general, les generateurs doivent etre initialises 
avec une valeur qui sert de racine pour engendrer la serie aleatoire. Si on reinitialise le gene- 
rateur avec la meme racine, il redonnera une sequence identique. Ceci est particulierement 
precieux pour le debogage d'une application. Par contre, pour rendre la sequence impre- 
visible, il faut utiliser une racine elle-meme la plus aleatoire possible (par exemple en lisant 
/dev/random). 

Commencons tout d'abord par les fonctions rand( ) et srand( ) qui sont definies par la norme 
C Ansi et declarees dans <stdl i b . h> : 

int rand (void); 

Cette fonction renvoie un nombre pseudo-aleatoire d'une serie uniformement repartie dans 
Fintervalle [0, RAND_MAX]. La constante symbolique RAND_MAX correspond au plus grand 
nombre aleatoire disponible. Le generateur employe par la GlibC fournit des nombres dont 
les bits de poids faibles sont aussi aleatoires que les bits de poids forts 2 . On peut done utiliser 
n'importe quelle methode pour reduire l'intervalle [0, RAND_MAX] a la plage de valeurs desirees 
(en prenant garde a pouvoir atteindre correctement les extremites). 

void srand (unsigned int racine); 

Cette fonction permet d'initialiser la sequence de nombres pseudo-aleatoires de randO. 
Lorsqu'on reinitialise la sequence avec la meme valeur, on obtient les memes nombres 
pseudo-aleatoires. Par defaut, la sequence est initialisee a 1 si on invoque randO avant de 
fournir une racine. II y a plusieurs methodes permettant de choisir une racine correcte. La plus 
simple, dans le cas d'un jeu par exemple, consiste a utiliser la date et l'heure, exprimees en 
secondes ecoulees depuis le l el janvier 1970 : 

srand (time (NULL)); 



1. II ne faut pas oublier que ces fichiers peuvent etre falsifies par wot (tout comme la bibliotheque C d'ailleurs), et il ne 
faut pas leur accorder une confiance aveugle en terme de securite. 

2. Ce n'etait pas le cas dans 1' implementation traditionnelle de randO sous Unix, aussi devait-on prendre garde a 
employer de preference les bits de poids forts qui etaient moins previsibles que ceux de poids faibles. 
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Ainsi, la sequence sera differente a chaque lancement de F application. Par contre, le compor- 
tement est previsible. Pour engendrer des mots de passe, on preferera utiliser une racine 
provenant d'un generateur aleatoire externe, comme /dev/random. 

La valeur courante de la sequence est memorisee dans une variable globale. Si on veut 
pouvoir acceder a une sequence repetable (pour le debogage) dans une application multi- 
thread, on peut utiliser l'extension rand_r( ) : 

int rand_r (unsigned int * racine) ; 

Elle renvoie une valeur aleatoire et stocke dans le pointeur fourni en argument son etat actuel. 
Le probleme est que le type unsi gned i nt est rarement assez grand pour permettre l'imple- 
mentation d'un bon generateur aleatoire. On adoptera de preference dans ce cas les exten- 
sions Gnu decrites dans la prochaine section. 

II existe des fonctions BSD declarees dans <stdlib.h>, randomO, srandomO, initstateO et 
setstate( ), qui ont a peu pres les memes fonctionnalites. Ces routines sont a present conside- 
rees comme obsoletes car elles sont limitees a des entiers sur 32 bits : 

int random (void) ; 

void srandom (unsigned int racine) ; 

Ces routines representent le pendant de randO et srandO. Les fonctions initstateO et 
setstateO ont une interface compliquee et servent simplement a sauvegarder ou a resti- 
tuer l'etat du generateur en utilisant un tableau d'entiers. Elles ne sont normalement plus 
utilisees. 

Generateur aleatoire de la bibliotheque mathematique 

Le generateur aleatoire de la bibliotheque mathematique est fonde sur le calcul de congruence 
suivant : 

r a =25214903917 
u n+ 1 = {(X ■ u n + P) mod(m), avec J j3 = 1 1 

[ m = 2 48 

Ce generateur fournit des valeurs sur 48 bits (ce qui explique la valeur de m), et il existe des 
fonctions permettant d' utiliser ces 48 bits pour construire les divers types de donnees : 

double drand48 (void) ; 

Cette fonction renvoie un reel dans l'intervalle [0, 1[. Comme nous ne disposons que de 
48 bits pour remplir un double, dont la fraction normalisee fait 52 bits, les 4 bits de poids 
faibles sont a 0. 

double erand48 (unsigned short int etat_generateur [3]); 

Cette fonction donne le meme resultat que drand48( ), mais elle utilise l'etat du generateur 
represente par le tableau transmis en argument. Ce dernier est ensuite mis a jour avec le 
nouvel etat. 

I long 1 rand48 (void) ; 

long nrand48 (unsigned short int etat_generateur [3]); 



Fonctions mathematiques 

Chapitre 24 



Ces deux fonctions renvoient une valeur entiere dans l'intervalle [0, 2 31 [, meme si la taille 
des 1 ong int est superieure a 32 bits. La fonction nrand48( ) utilise l'etat transmis et sauve- 
garde ensuite le nouvel etat du generateur. 

long mrand48 (void) ; 

long jrand48 (unsigned short int etat_generateur [3]); 

Ces deux fonctions renvoient une valeur entiere dans l'intervalle [— 2 31 , 2 31 [, meme si la 
taille des 1 ong i nt est superieure a 32 bits. La fonction j rand48( ) utilise l'etat transmis et 
sauvegarde ensuite le nouvel etat du generateur. 

Pour initialiser l'etat du generateur aleatoire, plusieurs routines sont disponibles : 
void srand48 (long int racine); 

Cette fonction utilise les 32 bits de poids faibles de la racine transmise (meme si le type 

I ong fait plus de 32 bits) pour initialiser les 32 bits de poids forts du generateur. Les 16 bits 
de poids faibles du generateur prennent la valeur 13 070. 

II s'agit de la routine la plus simple permettant d'initialiser - imparfaitement - le gene- 
rateur aleatoire. 

unsigned short int * seed48 (unsigned short int etat [3]); 

Avec cette routine, on peut definir les 48 bits utilises comme etat du generateur aleatoire. 
On n'utilise que les 16 bits de poids faibles de chacun des trois unsi gned short du tableau 
passe en argument. Le premier element du tableau sert a initialiser les 16 bits de poids 
faibles du generateur, le deuxieme correspond aux bits 16 a 31, et le troisieme contient les 
16 bits de poids forts. La fonction renvoie un pointeur sur un tableau contenant l'etat 
precedent. Celui-ci ne sert pas habituellement. 

void lcong48 (unsigned short int configuration [7]); 

Cette fonction est la plus complete car elle permet de definir non seulement l'etat du gene- 
rateur, mais egalement les valeurs a et /? de la formule indiquee plus haut. 

Les trois premiers elements du tableau servent a initialiser l'etat du generateur aleatoire, 
comme seed48( ). Les trois elements suivants contiennent les 48 bits de la constante a, et 
le dernier element comprend les 16 bits de /?. 

Lorsqu'on appelle srand48( ) ou seed48( ), les constantes act fi reprennent automatique- 
ment leurs valeurs par defaut. 

Les constantes etant stockees dans des variables globales, un probleme peut se poser avec des 
applications multithreads pour lesquelles plusieurs generateurs aleatoires avec des configura- 
tions differentes sont necessaires (encore que le cas soit plutot rare...). Pour cela, la GlibC 
offre des extensions Gnu permettant de passer en parametre les constantes. Ceci se deroule en 
utilisant un type opaque struct drand48_data. Pour pouvoir eventuellement renvoyer une 
valeur d'erreur (mauvais pointeur par exemple), les fonctions fournissent a present leur 
resultat par 1' intermediate d'un pointeur passe en parametre. 

Le fonctionnement des routines est le meme que le precedent, mais les prototypes devien- 
nent : 

int drand48_r (struct drand48_data * buffer, 
double * resultat); 
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int erand48_r (unsigned short int etat [3], 

struct drand48_data * buffer, double * resultat); 
int lrand48_r (struct drand48_data * buffer, 

long int * resultat) ; 
int nrand48_r (unsigned short int etat [3], 

struct drand48_data * buffer, long int * resultat); 
int mrand48_r (struct drand48_data * buffer, 

long int * resultat) ; 
int jrand48_r (unsigned short int etat [3], 

struct drand48_data * buffer, long int * resultat); 
int srand48_r (long int racine, 

struct drand48_data * buffer) ; 
int seed48_r (unsigned short etat [3], 

struct drand48_data * buffer) ; 
int lcong48_r (unsigned short configuration [7], 
struct drand48_data * buffer) ; 

Rappelons que l'utilite de ces routines n'est que ponctuelle. Elles ne servent que si chaque 
thread a besoin de configurer les constantes a et /? de son generateur aleatoire differemment 
des autres. Si on desire simplement que chaque thread dispose de sa propre sequence, il suffit 
d'utiliser les fonctions erand48(), nrand48() ou jrand48(). Enfin, si on veut que chaque 
thread recoive un nombre aleatoire independant des autres, sans qu'une sequence ne se repro- 
duise - ce qui est le cas le plus courant -, on peut utiliser drand48( ), 1 rand48( ) ou tnrand48( ). 



Conclusion 

L'emploi des fonctions mathematiques avec la GlibC peut etre motive par des besoins qui 
sont nombreux et differents. Pour un complement d'informations, on pourra se reporter par 
exemple a [Knuth 1973b] The Art of Computer Programming -volume 2, ou a [Press 1993] 
Numerical Recipes in C. 

On trouvera dans ces ouvrages de nombreuses discussions concernant les nombres aleatoires, 
la precision des representations en virgule flottante, les calculs de polynomes, la factorisation, 
etc. 

Pour les programmeurs recherchant des algorithmes geometriques (distance d'un point a une 
droite, changements de repere, etc.), ce qui represente une utilisation frequente de la biblio- 
theque mathematique, signalons que la Faq du groupe Usenet comp. graphics. algorithms 
contient de nombreux renseignements tres utiles a cet egard. 
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II est frequent qu'une application fasse un usage plus ou moins large de la date ou de l'heure. 
On peut desirer horodater des enregistrements ou des messages, memoriser des dates de nais- 
sance, vider les donnees trop vieilles se trouvant en memoire, ou simplement attendre une 
dizaine de secondes pour laisser a l'utilisateur la possibilite de reagir et de modifier la confi- 
guration par defaut. 

Malgre tout, la manipulation des dates est souvent source de problemes. II m'a fallu ecrire, 
pour une application de supervision d'un systeme de radiolocalisation, un module enregis- 
trant diverses statistiques (nombre de trames recues, etats de certains bits d'alarme, etc.)- Ces 
valeurs devaient etre memorisees et cumulees seconde par seconde sur la derniere minute, 
minute par minute sur la derniere heure, heure par heure sur les dernieres vingt-quatre heures, 
et jour par jour pendant un an. Les complications commencent lorsqu'on sait que les evene- 
ments a enregistrer n'arrivaient pas necessairement toutes les secondes mais pouvaient se 
produire une ou deux fois par mois seulement. Bien entendu, il fallait conserver quand meme 
les statistiques a jour en permanence et pouvoir les afficher a tout moment (en gerant notam- 
ment les problemes dus aux annees bissextiles). Ce genre de fonctionnalite devient vite assez 
acrobatique a elaborer, alors qu'il ne s'agit en realite que d'une partie accessoire d'un logiciel 
servant par ailleurs a tout autre chose. 

C'est peut-etre en cela que la manipulation des donnees horaires pose des difficultes. II s'agit 
souvent de fonctions annexes ou de simples routines d'affichage a l'ecran, auxquelles on 
n'accorde pas toujours l'attention necessaire. De plus, des cas particuliers peuvent se produire 
sortant largement du cadre des tests du logiciel. Le probleme de l'annee bissextile vient bien 
sur immediatement a l'esprit, mais on peut aussi citer l'horloge interne que l'administrateur 
ramene brutalement en arriere (ce qu'il ne devrait jamais faire, nous le verrons plus bas), ou 
le processus qui s'est endormi pendant une duree tres longue (plusieurs jours) car on a 
debranche par megarde un peripherique de communication, etc. 



660 



Programmation systeme en C sous Linux 



Nous nous interesserons en premier lieu a la lecture de l'heure et a la configuration de 
l'horloge interne. Nous examinerons ensuite les fonctions de conversion a utiliser pour affi- 
cher des resultats, puis nous aborderons le probleme des fuseaux horaires. 

Horodatage et type time_t 

L'horodatage sous Unix est realise a l'aide d'un type de donnee particulier, le type time_t. On 
y stocke le nombre de secondes ecoulees depuis le l el janvier 1970, a 0 heure TU, qu'on 
considere comme le debut de l'ere Unix (Epoch en anglais). L'essentiel des datations est 
accompli a l'aide de ce repere, ce qui rend bien entendu le noyau insensible aux problemes 
d'annees bissextiles ou de changement de siecle. La norme ISO C9X indique uniquement que 
le type time_t permet des operations arithmetiques, mais elle ne precise pas qu'il s'agit d'un 
nombre de secondes. En pratique c'est le cas sur tous les systemes Unix, mais si on desire 
vraiment assurer la portabilite d'une manipulation arithmetique horaire, on passera par une 
conversion intermediate en structure tin que nous verrons plus loin. 

Le type de donnee time_t etant exprime en secondes, il est facile a manipuler car on peut aise- 
ment ajouter un delai pour programmer une alarme, sans se soucier du debordement sur la 
minute, l'heure ou le jour suivant. Traditionnellement, les donnees time_t sont implementees 
sous forme d'entiers longs, signes de 32 bits. C'est le cas pour l'essentiel des implementa- 
tions de Linux, hormis les architectures SPARC. Ceci permet done de gerer des dates jusqu'a 
un maximum de 0x7FFFFFFF, soit 2 147 483 647 secondes depuis le l el janvier 1970. Mal- 
heureusement, ce nombre n'est pas aussi enorme qu'il en a Fair. Le mardi 19 janvier 2038 
a 3 heures 14 minutes et 7 secondes TU, les compteurs time_t 32 bits signes, s'il en reste, 
basculeront a 0x80000000, soit -2 147 483 648 secondes, et reviendront done au vendredi 
13 decembre 1901, a 20 heures 45 minutes et 52 secondes T.U. ! 

Bien sur, cela n'arrivera pas reellement, car d'ici la les noyaux Unix seront mis a jour pour 
traiter les donnees time_t avec un autre stockage, probablement un 64 bits signes. Le pro- 
bleme qui se pose toutefois est 1' interface des applications fonctionnant sur ces systemes. Car 
si le noyau modifie la longueur du type ti me_t, cela vaudra egalement pour la bibliotheque C 
et les applications qui utilisent les fonctions de lecture d'heure que nous verrons ci-dessous. 

Dans F immense majorite des cas, une simple recompilation permettra de mettre a niveau le 
logiciel. Toutefois, le cas des applications disponibles uniquement sous forme binaire posera 
un probleme essentiel, ainsi que pour les systemes gerant des bases de donnees dans 
lesquelles les dates sont stockees, avec fwriteO par exemple, de maniere binaire dans des 
fichiers. II sera necessaire d'ecrire des outils de conversion des bases de donnees. 

L'an 2038 peut paraitre bien eloigne aujourd'hui. Une bonne partie des informaticiens actuels 
ne seront plus en activite a ce moment-la, aussi le probleme ne leur semble pas aussi crucial 
que cela. Pourtant, ce raisonnement est faux pour plusieurs raisons : 

• Le vent de panique cree lors du passage a l'an 2000 devrait nous servir de lecon pour 
savoir qu'on ne peut pas predire la duree de vie d'une application. Elle peut non seulement 
etre utilisee bien plus longtemps que ce qu'on estimait lors de son ecriture, mais cela 
semble encore plus vrai pour les logiciels dont les sources ne sont pas disponibles. 

• II existera de plus en plus de systemes embarques, qu'on trouvera dans les appareils electro- 
menagers, hi-fi, voitures, appareils photographiques numeriques . . . Le logiciel embarque 
sera de plus en plus evolue, et une bonne partie sera constitute d'un veritable noyau Unix 
sur lequel tournera 1' application faisant fonctionner le materiel, mais egalement des outils 
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de communication, pour la programmation, le parametrage ou revolution du logiciel. La 
duree de vie de ces appareils pourra etre tres longue, et des applications concues dans un 
avenir proche pourront fort bien continuer d'exister dans des equipements fonctionnant 
toujours en 2038. 

• De nombreux programmes n'ont pas besoin d'attendre 2038 pour etre confronted a ce 
probleme. Un logiciel de calcul astronomique peut par exemple etre employe pour prevoir 
des evenements 10, 15, 20 ans a Favance. II en est de meme pour un programme faisant 
des calculs d'amortissements pour un emprunt sur 20 ou 25 ans. II devra alors faire face au 
bogue de 2038 des 1' an 2013. Le delai restant est alors largement diminue. 

Pour toutes ces raisons, il est important pour un programmeur applicatif de commencer a se 
preoccuper de Futilisation qu'il fait des donnees time_t. Les manipulations internes dans le 
programme ne posent en fait pas vraiment de probleme. Une recompilation du logiciel 
permettra de prendre en compte la nouvelle longueur lorsqu'il le faudra. 

Les difficultes s'annoncent lorsqu'on doit stocker des dates dans un fichier ou les communi- 
quer a un autre systeme. Dans un cas comme dans 1' autre, si on est maitre des deux extremites 
de la transmission (lecture et ecriture du fichier, ou emission et reception des donnees), on 
peut employer un subterfuge consistant a transferer les donnees de type ti me_t dans un entier 
long long int, qui dispose au moins de 64 bits sur les systemes actuels. Ce sera alors cette 
variable qui sera utilisee pour la transmission ou le stockage. La conversion inverse suppri- 
mera les bits supplementaires, inutilises a ce moment-la, tant que le type time_t n'aura pas 
evolue. 

Si cette solution n'est pas possible, il faut se contenter de bien documenter par des commen- 
taires precis les emplacements ou la taille des donnees time_t est prise en compte. Les evolu- 
tions qui permettront de basculer sur un type plus long ne sont pas encore previsibles. Peut- 
etre verra-t-on apparaitre un type time64_t intermediaire ou une utilisation des 32 bits de 
maniere non signee, ce qui permettrait de gagner pres de 70 ans de plus 1 . 

Lecture de I'heure 

L appel-systeme le plus simple pour lire I'heure actuelle est timeO, que nous avons deja 
observe rapidement dans le chapitre 9, et qui est declare dans <time . h> : 

time_t timet time_t * heure); 

Cet appel-systeme renvoie la date et I'heure actuelles, et remplit la variable transmise en argu- 
ment avec cette meme valeur si le pointeur n'est pas NULL. Si jamais le pointeur est invalide, 
t i me ( ) retourne la valeur d' erreur ( ( t i me_t ) - 1 ) . Cet appel-systeme est simple, portable - defini 
par SUSv3 et Ansi C -, et nous avons vu que le type de donnee ti me_t est facile a manipuler. 

II peut arriver cependant qu'on ait besoin de dater des evenements avec une precision plus 
grande que la seconde. Pour cela, il existe un appel-systeme fournissant une meilleure resolu- 
tion. Lappel gettimeofday( ) est declare dans <sys/time.h>, ainsi que les types des donnees 
qu'il emploie : 

int gettimeofday (struct timeval * timev, struct timezone * timez); 



1. Le type time_t n'est pas necessairement signe, il faut simplement que ((time^t) -1) ait une signification. Cela est 
possible meme avec un entier non signe, par exemple ( ( unsi gned char) -1 ) vaut 255. La valeur OxFFFFFFFF sera done une 
valeur d'erreur. 
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Cette fonction remplit les deux structures sur lesquelles on passe des pointeurs - s'ils ne sont pas 
NULL -, et renvoie 0 si elle reussit et-1 en cas d'erreur. La structure timeval, deja vue aplusieurs 
reprises avec wait3( ), setitimer( ) ou encore sel ect( ), contient les deux membres suivants : 



Norn Type 


Signification 




tv_sec time_t 


Nombre de secondes ecoulees depuis le 1 er janvier 1970 




tv_usec time_t 


Nombre de microsecondes depuis le dernier changement de tv_sec 





Bien entendu, on pourrait construire la fonction time( ) a partir de gettimeofday ( ) ainsi : 

time_t 
time (time_t * timer) 
{ 

struct timeval timev; 
gettimeofday (& timev, NULL); 
if (timer != NULL) 

* timer = timev. tv_sec; 
return timev. tv_sec; 

} 

Toutefois, sous Linux, F implementation est encore sous forme d'appel-systeme independant, 
ce qui presente par ailleurs l'avantage d'une meilleure verification de la validite du pointeur 
transmis. 

La structure timezone contient deux membres : 



Norn 


Type 


Signification 


tz_minuteswest 


int 


Nombre de secondes de decalage vers I'ouest depuis Greenwich 


tz_dsttime 


int 


Type d'horaire hiver / ete applique localement 



La structure timezone est quasi obsolete et ne doit pas etre utilisee. Nous verrons a la fin de ce 
chapitre comment acceder aux informations sur les fuseaux horaires. Le premier membre de 
timezone peut indiquer correctement la bonne valeur, mais le second n'est jamais mis a jour. 
Dans la plupart des cas, on n'utilisera jamais le second argument de gettimeofday ( ), et on 
passera done un pointeur NULL. 

Voyons done les comportements de time( ) et de gettimeofday( ) : 
exemple_gettimeofday.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <time.h> 
#include <unistd.h> 
#1nclude <sys/time.h> 

int 
main (void) 
{ 

struct timeval timev; 
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if (gettimeofday(& timev, NULL) != 0) { 
pernor ( "gettimeofday" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

fprintf (stdout, "timet) : %ld \n", time (NULL) ) ; 
fprintf (stdout, "gettimeofday ( ) : %ld.%061d\n", 

timev . tv_sec, timev . tv_usec); 
return (0); 

} 

L' execution montre bien le meme resultat au niveau seconde et une meilleure precision de 
gettimeofday( ). 

$ ./exemple_gettimeofday 

timet ) : 1105008472 
gettimeofdayO : 1105008472.756992 
$ 

Nous mentionnerons egalement l'existence d'une fonction obsolete nommee ftimeO, 
declaree dans <sys/timeb . h> : 

int ftime (struct timeb * timeb); 

La structure timeb regroupait en fait les champs des structures timeval et timezone ainsi : 



Nom 


Type 




Equivalence 


time 


time_t 


timeval . 


tv_sec 


milli tm 


unsigned short int 


timeval . 


tv_usec 


timezone 


short int 


timezone 


. tz_minuteswest 


dstf 1 ag 


short int 


timezone 


. tz_dsttime 



Configuration de I'heure systeme 

Le reglage de I'heure du systeme est une operation evidemment privilegiee, necessitant un 
UID effectif nul ou la capacite CAP_SYS_TIME. II existe trois appels-systeme permettant de 
modifier I'heure de la machine : settimeofday ( ), qui est un heritage de BSD, stimeO, qui 
provient de Systeme V, et adjtimexO, qui est specifique a Linux. Leurs prototypes sont 
declares respectivement dans <sys/time . h>, <time.h> et <sys/timex. h> ainsi : 

int settimeofday (const struct timeval * timeval, 

const struct timezone * timezone); 
int stime (time_t * heure); 
int adjtimex (struct timex * timex); 

L'appel-systeme settimeofday ( ) fonctionne a l'inverse de gettimeofdayO, en configurant 
I'heure et eventuellement le fuseau horaire de la machine. 

L'appel stimeO peut tres bien etre implemente a partir de settimeofdayO, comme nous 
l'avons observe pour son antagoniste time( ). 

Enfin, adjtimexO sert non seulement a regler I'heure de l'horloge interne, mais permet aussi 
d' organiser des parametres complexes pour ajuster la regularite de l'horloge et eviter des derives 
periodiques. Ce sujet sort largement du cadre de notre etude, et nous laisserons le lecteur que 
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cela interesse se reporter directement aux sources du noyau, en etudiant les fichiers kernel/ 
time. c et a rch/xxx/ kernel /time.c, ou a la RFC 956, qui decrit le principe de cet algorithme. 

II est fortement deconseille d'utiliser directement ces appels-systeme. En effet, l'horloge du 
noyau doit fonctionner de la maniere la plus monotone possible. Modifier bmtalement l'heure 
du systeme ou, pire encore, la faire revenir en arriere peuvent perturber gravement certains pro- 
cessus qui traitent des donnees horodatees. Pour configurer l'horloge de la machine, on preferera 
employer la fonction de bibliotheque adjtime( ), specifique a l'extension Gnu et declaree dans : 

int adjtime (const struct timeval * modification, 
struct timeval * ancienne); 

Cette fonction prend en premier argument un pointeur sur une structure ti meval contenant la dif- 
ference entre l'heure desiree et l'heure actuelle. Cette difference peut notamment etre negative, 
si on desire retarder l'horloge. La bibliotheque C va alors ralentir l'horloge systeme de maniere 
a rattraper progressivement la valeur voulue. De meme, lorsque la difference est positive, l'hor- 
loge sera acceleree pour combler peu a peu l'ecart. Si le second argument est un pointeur non 
NULL, on y stocke la modification precedemment demandee et qui n'a pas fini d'etre appliquee. 

Cette fonction est tres precieuse par exemple pour synchroniser plusieurs machines d'un 
reseau local en employant le protocole NTP (defini dans la RFC 1305). 

Conversions, affichages de dates et d'heures 

Pour le moment nous n'avons manipule la date et l'heure que sous forme de donnees de type 
time_t (ou de structures timeval qui l'encadrent en ajoutant les microsecondes). Nous avons 
observe que ce type est pratique (1' unite etant la seconde, il est tres intuitif), robuste (pas de 
probleme d'annees bissextiles ou de changement de siecle), et portable (defini par SUSv3 et 
Ansi C). Toutefois, malgre tous ces avantages, on arrive difficilement a faire comprendre a 
l'utilisateur que 947846794 est plus commode que 14 janvier 2000 all heures 46 minutes et 
34 secondes. II faut done trouver le moyen de convertir les secondes du type time_t en ele- 
ments plus lisibles par un utilisateur moyen. La bibliotheque C nous fournit plusieurs routines 
de traduction. 

Tout d'abord, il existe une structure de donnees permettant de representer la date et l'heure 
sous forme intelligible. La structure tm est definie par le standard Ansi C et contient les 
membres suivants, qui sont tous de type i nt : 



Nom 


Signification 


tm_sec 


Nombre de secondes ecoulees depuis le dernier changement de minute, dans I'intervalle 0 a 60 


tm_mi n 


Nombre de minutes ecoulees depuis le dernier changement d'heure, entre 0 et 59 


tm_hour 


Nombre d'heures ecoulees depuis minuit, dans I'intervalle 0 a 23 


tm_mday 


Jour du mois, allant de 1 a 31 


tm_mon 


Nombre de mois ecoules depuis le debut de I'annee, dans I'intervalle 0 a 1 1 


tm_year 


Nombre d'annees ecoulees depuis 1900 


tm_wday 


Nombre de jours ecoules depuis dimanche dans I'intervalle 0 a 6 


tm_yday 


Nombre de jours ecoules depuis le 1 er janvier, dans I'intervalle 0 a 365 


tm_isdst 


Indicateur d'horaire d'ete ou d'hiver 
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Plusieurs points appellent des commentaires dans ce tableau : 

• Les secondes peuvent aller de 0 a 60, car il existe parfois des secondes de rattrapage perio- 
dique, definies par les instances astronomiques internationales. Une minute officielle peut 
done durer 59, 60 ou 61 secondes. En realite, les fonctions de la bibliotheque C ne 
renvoient jamais de valeur superieure a 59, comme cela est demande par SUSv3 (elles 
arrondissent au besoin a la minute superieure). Par contre, on peut legitimement remplir le 
champ tm_sec avec une valeur allant jusqu'a 60 en entree des fonctions de la GlibC. Un 
programme portable devra done etre pret a traiter ce cas, par exemple s'il utilise les 
secondes comme index dans un tableau de statistiques. II faudra alors soit prevoir 
61 emplacements, soit utiliser une astuce comme index=(tm.tm_sec % 60) ou index 
=(tm.tm_sec < 60 ? tm.tm_sec : 59). 

• Le jour du mois commence a 1 et n'est done pas directement utilisable comme index dans 
une table, mais il peut etre affiche. Par contre, le numero du mois debute a zero. II faut lui 
ajouter 1 pour l'affichage. 

• Le membre tm^ year indique le nombre d'annees ecoulees depuis 1900. Lan 2000 est done 
represente par un 100. Pour afficher l'annee sur deux chiffres, on emploiera done (tiruyear 
% 100). Ceci ne pose plus de probleme pour les nouvelles applications puisque en cas 
d'erreur le probleme apparaitra des les premiers tests avec par exemple un affichage 25/12/ 
101. Par contre, de nombreux logiciels concus jusqu'en 1999 peuvent souffrir d'un defaut 
d' attention du programmeur face a cette caracteristique. 

• La semaine commence, a l'anglaise, le dimanche et pas le lundi. Le champ tm_wday va de 0 
a 6, pouvant servir d'index dans un tableau initialise ainsi : char * jours[7] = { "D" , "L" , 
"Ma", "Me", "J", "V", "S"}; 

• Le membre tm_isdst a une valeur positive si l'horaire d'ete est en vigueur, nulle si 
l'horaire normal (hiver) fonctionne, et negative si cette information n'est pas disponible. 

La bibliotheque GlibC ajoute egalement deux autres membres tm_gmtof f et tm_zone, qui 
correspondent respectivement au nombre de secondes qu'il faut ajouter a la date indiquee 
pour obtenir le temps TU, et au nom (sous forme de chaine de caracteres statique) du fuseau 
horaire employe. Ces deux champs ne sont pas standard et nous ne les traiterons pas ici. 

Les routines de conversion de format de date renvoient traditionnellement des pointeurs sur 
des zones de memoire allouees statiquement. Ces donnees sont done ecrasees a chaque 
nouvel appel de la meme fonction. Ceci rend impossible leur utilisation dans un contexte 
multithread. Aussi la bibliotheque GlibC inclut-elle des extensions Unix 98 avec le suffixe _r 
pour definir une version reentrante de chacune de ces routines. 

Pour convertir une valeur de type time_t en structure tm, il existe deux fonctions, 1 ocal time( ) 
et gmtime( ), et leurs homologues reentrantes : 

struct tm * localtime (const time_t * date); 

struct tm * localtime_r (const time_t * date, struct tm * tm); 

struct tm * gmtime (const time_t * date); 

struct tm * gmtime_r (const time_t * date, struct tm * tm); 

Bien entendu, les deux premieres routines renvoient l'heure locale, en se fondant sur la confi- 
guration des fuseaux horaires que nous verrons plus bas, alors que les deux dernieres retour- 
nent l'heure TU. 
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Voici un exemple d'emploi de ces routines : 

exemplejocaltime.c : 

#include <stdio.h> 
#include <time.h> 

int 
main (void) 
{ 

time_t temps; 
struct tm * tm; 

time(& temps ) ; 

fprintf (stdout, "timet) = %ld \n", temps); 
tm = localtime(& temps); 

fprintf(stdout, "localtimeO = %02d/%02d/%02d - 2;02d:%02d:%02d %s\n" , 
tm->tm_mday, tm->tm_mon + 1, tm->tm__year % 100. 
tm->tm_hour, tm->tm_min, tm->tm_sec, 

tm->tm_isdst>0 ? "Ete" : tm->tm_isdst==0 ? "Normal" : "?"); 
tm = gmtime (& temps) ; 

fprintf (stdout, "gmtimeO = %02d/%02d/%02d - 2;02d:%02d:%02d %s\n" . 
tm->tm_mday, tm->tm_mon + 1, tm->tm__year % 100. 
tm->tm_hour, tm->tm_min, tm->tm_sec. 

tm->tm_isdst>0 ? "Ete" : tm->tm_isdst==0 ? "Normal" : "?"); 
return EXIT_SUCCESS; 

} 

Les executions suivantes du programme ont lieu dans le fuseau horaire de Paris : 

$ ./exemple_localtime 

timet) = 932303050 

localtimeO = 18/07/99 - 15:04:10 Ete 
gmtimeO = 18/07/99 - 13:04:10 Normal 
$ 

L'horaire d'ete est bien detecte, voyons l'horaire d'hiver : 

$ ./exemple_localtime 

timet) = 947855103 

localtimeO = 14/01/00 - 14:05:03 Normal 
gmtimeO = 14/01/00 - 13:05:03 Normal 
$ 

La traduction inverse est possible, grace a la fonction mktimet ) : 

time_t mktimetstruct tm * tm); 

Cette routine peut renvoyer (time_t)-l en cas d'erreur, mais elle essaye toutefois d'etre la 
plus robuste possible. Elle ignore les membres tiruyday et tm_wday de la structure tm trans- 
mise, elle les recalcule grace aux autres donnees et les remet a jour. Si un membre a une 
valeur invalide, la fonction mkti me ( ) calcule son debordement. Par exemple, 23h70 est corrige 
pour correspondre a OhlO du jour suivant. 

On peut bien entendu utiliser une fonction de la famille printf ( ) pour presenter le contenu 
d'une structure tm, comme nous Favons fait ci-dessus, mais lorsqu'on desire afficher la date 



Fonctions horaires 

Chapitre 25 



uniquement a titre informatif pour l'utilisateur, il est souvent plus simple d'utiliser Fune des 
fonctions asctimeO et ctimeO, qui renvoient des chaines de caracteres statiques, ou leurs 
homologues asctime_r() et ctime_r(), qui utilisent un buffer passe en argument, pouvant 
contenir au minimum 16 caracteres. 

char * asctime (const struct tm * tm); 

char * asctime_r (const struct tm * tm, char * buffer); 

char * ctime (const time_t * date); 

char * ctime_r (const time_t * date, char * buffer); 

La fonction ct1me( ) est l'equivalent de asctime (1 ocal time (date) ). Le resultat de ces fonc- 
tions est une chaine de caracteres contenant : 

• Le jour de la semaine, parmi les abreviations Mon, Tue, Wed, Thu, Fri, Sat, Sun ; 

• Le nom du mois parmi Jan, Feb, Mar, Apr, May, Jun, Jul, Aug, Sep, Oct, Nov, Dec , 

• Le numero du jour dans le mois ; 

• L'heure, les minutes et les secondes ; 

• Lannee sur quatre chiffres ; 

• Un caractere 'W de retour a la ligne. 
En voici une illustration tres simple. 

exemple_ctime.c : 

#include <stdio.h> 
#include <time.h> 

int 
main (void) 

{ 

time_t t; 
t = time(NULL); 

fprintf (stdout, "Is", ctime(& t)); 
return EXIT_SUCCESS; 

} 

$ ./exemple_ctime 

Thu Jan 6 11:54:44 2005 
$ 

Nous voyons qu'avec ctime( ) ou asctimet ) le format d'affichage est fige. De plus, le nom 
des jours et des mois est en anglais. Ces routines ne sont pas sensibles a la localisation du 
processus. Pour pallier ces problemes, la bibliotheque C propose une routine definie par 
SUSv3, strftime( ), tres puissante mais legerement plus compliquee puisqu'elle fonctionne 
un peu sur le principe de la famille printf ( ). 

size_t strftime (char * buffer, size_t longueur, 

const char * format, const struct tm * tm); 

Cette fonction remplit le buffer passe en premier argument, dont la taille est indiquee en 
second argument. Si ce buffer est trop court, strftimeO renvoie 0. Sinon, elle transmet le 
nombre de caracteres ecrits, sans compter le '\0' final. Le contenu du buffer est constitue des 
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champs de la structure tm indiques dans la chaine de format passee en troisieme argument. 
Les codes employes sont indiques dans le tableau suivant : 



Code 


Signification 


%% Le caractere %. 


Ik 


Le nom complet du jour de la semaine. 


%a 


Le nom abrege du jour de la semaine. 


SB 


Le nom complet du mois. 


%b 


Le nom abrege du mois. 


%C 


Le siecle (1 9 pour 1 977, 20 pour 201 5). 


%c 


La date et I'heure dans la representation locale usuelle. 


%D 


La date, cans le tormat %m/%a//t,y. 


%d 


Le jour du mois dans I'intervalle 1 a 31 . 


%e 


Le jour du mois dans I'intervalle 1 a 31, precede par un blanc pour les valeurs inferieures a 10, afin de 
permettre un alignement a droite. 


%F 


La date, dans le format %Y-%m-%d. Ce format est defini par la norme ISO 8601 , il deviendra probablement 
de plus en plus repandu dans I'avenir. 


%g 


Le numero de I'annee sur deux chiffres, correspondant a la semaine en cours. II peuty avoir une difference 
avec %y pour les premiers ou derniers jours de I'annee. 


%G 


Comme %g , mais sur quatre chiffres. 


%h 


Comme %b. 


%W 


Lheure sur 24 heures et sur deux chiffres, de 00 a 23. 


%l 


Lheure sur 1 2 heures et sur deux chiffres , de 00 a 1 1 . 


%3 


Le numero du jour de I'annee sur trois chiffres, de 001 a 366. 


%k 


Lheure sur 24 heures, mais avec un espace devant les valeurs inferieures a 10, allant done de 0 a 23. 
Extension Gnu. 


%1 


Comme %k. mais sur 12 heures. Extension Gnu. 


ZM 


La minute sur deux chiffres, de 00 a 59. 


%m 


Le numero du mois, sur deux chiffres, de 01 a 12. 


%n 


Un caractere An' de retour a la ligne. 


%f 


Comme %p, mais en majuscules. Extension Gnu. 


!tp 


Lequivalent local des chaines «am» ou «pm» de I'heure sur 12 heures. Minuit est considere comme Oh am 
et midi comme Oh pm. 


%R 


Lheure et la minute au format %H : %M. Extension Gnu. 


%r 


Lheure complete, sur 12 heures, y compris les equivalents locaux de am et pm. 


%S 


Les secondes sur deux chiffres, de 00 a 60. 


%s 


Le nombre de secondes ecoulees depuis le 1 er janvier 1 970 a 0 heure TU. Extension Gnu. 


%\ 


Lheure au format %H:%M:%S. 


%t 




Le caractere '\t' de tabulation. 
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Code Signification 



zu 


Le numero de la semaine dans l'annee, allant de 00 a 53. La semaine numero 1 de l'annee commence au 

r\umiQK Himarmna 1 do ir\i iko nraoon^nt Hiin^nrha pnnt none o camQina C\ 
piUIMIUI UUIIdMLMt:. Lcb JUUIO picLcUdlll UlllldllOMc oUlll Udllo Id bcllldlllc U. 




Le numero du jour dans la semaine, de 1 a 7, avec 1 correspondant au lundi. 




Le numero de la semaine dans I'annee de 1 a 53. La reference prise ici commence au premier lundi de 
I'annee, comme le precise la norme ISO 8601 . 


xw 


Comme %V , mais de 0 a 53, les jours precedant le premier lundi etant dans la semaine 0. 


Xw 


Le jour de la semaine de 0 a 6, en commencant le dimanche. 


U 


La representation locale usuelle de I'heure. 


%x 


La representation locale usuelle de la date. Le compilateur nous avertit lorsqu'on utilise %x dans une 
chaine constante que cette representation se fait avec des annees sur deux chiffres dans certaines 
localisations. Cet avertissement peut etre ignore si on est conscient de ce fait. 


%i 


L'annee sous forme de nombre decimal complet. 


2y 


L'annee sur deux chiffres, sans le siecle. 


%i 


Le nom du fuseau horaire abrege, eventuellement vide. 


%z 


Le fuseau horaire indique sous forme numerique conforme a la RFC 822. 



Lorsqu'on transmet un buffer NULL, strftime( ) nous indique le nombre de caracteres qu'elle 
aurait du ecrire dedans. Ceci est tres utile car, dans certaines situations, cette fonction peut 
renvoyer legitimement 0 alors que le buffer est bien assez grand. C'est le cas par exemple si 
on demande uniquement le code %p alors que la localisation permet seulement l'emploi du 
temps sur 24 heures. Nous allons employer cette methode dans le programme suivant. 

exemple_strftime.c : 

#1 nclude <limits.h> 

^include <locale.h> 

^include <stdio.h> 

^include <stdlib.h> 

#include <time.h> 

int 

main (int argc, char * argv[]) 

{ 

int i ; 

int lg; 

char * buffer; 

struct tm * tm; 

time_t heure; 

setlocale(LC_ALL, ""); 

time(& heure) ; 

tm = localtime(& heure); 

for (i = 1; i < argc; i ++) { 

fprintf (stdout, "£s : ", argv[i]); 
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lg = strftime(NULL, SSIZE_MAX, argv[l], tm); 
if (lg > 0) { 

buffer = mallocdg + 1) ; 
if (buffer == NULL) { 
perror( "mal 1 oc" ) ; 
exit(EXIT_FAILURE); 

} 

strftimetbuffer, lg + 1, argv[i], tm); 
fprintf (stdout, "%s", buffer); 
f ree(buffer) ; 

} 

fprintf (stdout, "\n"); 

} 

return EXIT_SUCCESS; 

} 

Ce programme permet d'afficher la date et l'heure courantes avec le format transmis en argu- 
ment de la ligne de commande. En voici quelques exemples : 

$ ./exemple_strftime "Le %d %B »Y. a %H heures %M" 

Le %d %& %y, a %H heures %W : Le 06 janvier 2005, a 11 heures 59 
$ ./exemple_strftime %p 

%p : 

$ ./exemple_strftime "%Z (%z)" 

%l (%z) : CET (+0100) 
$ 

Nous remarquons que dans la localisation francaise, le code %p (AM / PM) n'a pas de signifi- 
cation. 

Bien entendu, la bibliotheque GlibC propose des fonctions permettant le cheminement inverse, 
c'est-a-dire la creation d'une structure tm a partir d'une chaine de caracteres qui peut avoir ete 
saisie par Futilisateur. Deux fonctions existent, strptimeO et getdateO, toutes deux decla- 
rers dans <time. h> et definies par SUSV3. 

char * strptime (const char * chaine_lue, const char * format, 
struct tm * tm) ; 

Cette routine fonctionne un peu comme sscanf ( ). Elle examine le contenu de la chaine trans- 
mise en premier argument, a la lumiere du format precise en second argument. Le resultat est 
alors stocke dans la structure tm, puis renvoie un pointeur sur le premier caractere de la chaine 
initiale qui n'a pas ete converti. 

La mise en correspondance entre la chaine lue et le format est faite octet par octet, chaque 
caractere du format devant avoir un equivalent dans la chaine, sinon la lecture s'arrete. Bien 
entendu, des codes speciaux identiques a ceux de strftime( ) peuvent etre inseres pour lire les 
champs de la structure tm. Les codes etant les memes, la fonction strptimet ) est done syme- 
trique a strftime( ), et peut aussi bien etre employee pour relire des donnees ecrites par un 
programme que pour lire une saisie humaine. 

Si toute la chaine a pu etre analysee, le pointeur transmis correspond au caractere nul final, 
'\0'. Par contre, si aucune conversion n'apu avoir lieu, le pointeur est NULL. II faut done syste- 
matiquement verifier cette condition avant d'essayer de consulter le contenu du pointeur, sous 
peine de declencher une erreur SIGSEGV. 
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La bibliotheque GlibC met a jour uniquement les champs de la structure tm qui ont ete lus, 
ainsi que les champs tm_wday et tm^ yday. Les autres membres ne sont pas modifies. Pour veri- 
fier le resultat de la fonction, il est done conseille d' initialiser tous les membres avec une 
valeur impossible, comme -1 ou INT_MAX. Cela permettra de s'assurer de la reussite de la 
conversion. Si on veut eviter cette etape, on peut eventuellement initialiser tous les membres 
avec des zeros, ainsi la structure aura toujours un contenu coherent. 

Pour que strpti me ( ) soit declaree dans <ti me . h>, il faut definir la constante symbolique _X0PEN_ 
SOURCE avant l'inclusion de cet en-tete. 

Le programme suivant va lire la ou les chaines de formats successifs sur sa ligne de commande, 
en afficher un exemple sur stdout, et demander a l'utilisateur une saisie sur stdin. La meme 
structure tm sera utilisee tout au long des saisies. Ensuite, le resultat sera affiche au complet. 

exemple_strptime.c : 

#define _X0PEN_S0URCE 
#include <limits.h> 
#include <locale.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <time.h> 

int 

main (int argc, char * argv[]) 

{ 

int i ; 

int lg; 

time_t heure; 

struct tm tm; 

struct tm * exemple; 

char * buffer; 

char * retour; 

setlocale(LC_ALL, ""); 

time(& heure) ; 

exemple = 1 ocal time(& heure); 
memset(& tm, 0, sizeof (struct tm)); 

for (i = 1; i < argc ; i ++) { 

lg = strftime(NULL, SSIZE_MAX, argv[i], exemple); 
if (lg > 0) { 

/* On alloue 2 octets de plus pour \n et \0 */ 
buffer = mallocdg + 2); /* retour a verifier...*/ 
strftime(buffer, lg + 2, argv[i], exemple); 
fprintf (stdout, "Format %s (exemple %s) : ", 
argv[i], buffer); 

while (1) { 

fgets(buffer, lg + 2, stdin); 

retour= strptimetbuffer, argv[i], & tm); 

if (retour == NULL) 

fprintf (stdout, "Erreur > "); 
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el se 

break; 

} 

f ree(buffer) ; 

} 

} 

putstasctime (& tm)); 
return EXIT_SUCCESS; 

} 

Voici un exemple d' execution simple, mais interessant a plusieurs egards : 

$ ./exemple_strptime "Le %x" "a %X" 

Format Le %x (exemple Le 16.01.2000) : Le 4.7.1967 
Format a 11 (exemple a 20:09:52) : a 4:20:0 
Tue Jul 4 04:20:00 1967 

$ ./exemple_strptime %F %r 

Format %? (exemple 2000-01-16) : 2222-2-2 

Format %r (exemple 08:11:11 ) : 20:12:10 

Erreur > 20:10 

Erreur > 08:10:10 

Erreur > 08:10:10 PM 

Erreur > (Controle-C) 

$ 

Nous remarquons plusieurs choses : 

• Les versions precedentes de la bibliotheque C ne savaient pas calculer les jours pour les 
dates anterieures au l el janvier 1970. Ce defaut est de nos jours corrige. 

• Le format %r pose des problemes car, dans le cas d'une localisation francaise, la chaine 
AM/PM est indefinie. Lors d'un affichage avec strftimeO, tout est masque car une 
chaine vide est affichee, mais lors d'une ecriture, la mise en correspondance n'est pas 
possible. Ceci peut engendrer de serieux problemes, qui n'apparaitront que lors de 1' expor- 
tation d'une application. 

• On peut egalement regretter 1' absence de code d' erreur indiquant le type de probleme qui 
s'est presente. 

La bibliotheque C met done a notre disposition la fonction getdateO et sa correspondante 
getdate_r( ), qui peuvent simplifier la lecture des chaines contenant des donnees d'horoda- 
tage : 

struct tm * getdate (const char * chaine_lue); 
int getdate_err; 

int getdate_r (const char * chaine_lue, struct tm * tm); 

La fonction getdate ( ) analyse la chaine transmise et renvoie un pointeur vers une structure tm 
statique representant la date obtenue. En cas d' erreur, elle retourne un pointeur NULL et posi- 
tionne la variable globale getdate_err avec un code d'erreur detaille ci-dessous. La fonction 
getdate_r() n'emploie pas de structure statique, mais utilise le pointeur passe en second 
argument. En consequence, elle renvoie un code de retour signalant les conditions d'erreur, 
mais n'utilise pas la variable getdate_err. 
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Pour realiser F analyse de la chaine, ces routines utilisent la variable d'environnement 
DATEMSK. Celle-ci doit contenir le chemin d'acces et le nom d'un fichier comprenant des 
motifs de conversion identiques a ceux qui sont employes par strptimeO. Chaque motif 
possible est presente sur une ligne du fichier, et ils sont essayes successivement jusqu'a ce que 
Fun d'eux soit correct. L'utilisateur a done la possibilite de configurer le format de la conver- 
sion en fonction de ses habitudes (ou du logiciel employe pour fournir les donnees d'entree 
alimentant la routine getdate( ) concernee). 

En contrepartie, la possibilite d'indiquer soi-meme le fichier contenant les motifs a utiliser 
peut constituer une faille de securite dans un programme Set-UID (car on peut alors consulter 
n'importe quel fichier du systeme, y compris /etc/shadow dont nous parlerons dans le 
prochain chapitre). Dans un tel cas, on evitera d'employer getdate( ) ou on figera lors de la 
compilation le contenu de la variable d'environnement DATEMSK, en utilisant la routine 
setenv( ) etudiee au chapitre 3. 

Les codes d'erreur transmis par getdateO dans getdate_err ou renvoyes par getdate_r() 
sont : 



Valeur 


Signification 


0 


Pas d'erreur. 


1 Variable DATEMSK non configured ou contenant une chame vide. 


2 


Le fichier de motifs indique dans DATEMSK ne peut pas etre ouvert. 


3 


L'etat du fichier de motifs n'est pas accessible. 


4 


Le fichier de motifs n'est pas un fichier regulier. 


5 


Impossible de lire le contenu du fichier de motifs. 


6 


Pas assez de memoire disponible. 


7 


Impossible de trouver un motif permettant de realiser une conversion correcte. 




La chaine contient des donnees invalides apres conversion (par exemple 31 avril). 



Pour que les prototypes de ces routines soient presents dans <time.h>, il faut remplir la 
constante symbolique _X0PEN_S0URCE avec la constante 500 avant d'inclure ce fichier d'en- 
tete. 

Les membres de la structure tm qui ne sont pas renseignes par la chaine fournie sont initialises 
avec la date et Fheure de Fappel de la routine. Voici un programme qui emploie getdate( ) 
pour analyser les chaines transmises en ligne de commande. 

exemple_getdate.c : 

#define _X0PEN_S0URCE 500 
#include <stdio.h> 
frinclude <stdlib.h> 
#include <time.h> 

int 

main (int argc, char * argv[]) 
{ 

struct tm * tm; 
int i ; 
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for (i = 1; i < argc; i ++) { 

fprintf (stdout, "%s : ", argv[i]); 
tm = getdate(argv[i ] ) ; 
if (tm == NULL) 

switch (getdate_err) { 
case 1 : 

fprintf (stdout, "DATEMSK indefinie \n"); 

break; 
case 2 : 
case 3 : 
case 4 : 
case 5 : 

fprintf (stdout, "Fichier de motifs invalide \n"); 
break; 
case 6 : 

fprintf (stdout, "Pas assez de memoire \n"); 
break; 
case 7 : 

fprintf (stdout, "Conversion impossible \n"); 
break; 
case 8 : 

fprintf (stdout, "Valeur invalide \n"); 
break; 

} 

el se 

fprintf (stdout, "%s" , asctime(tm) ) ; 

} 

return EXIT_SUCCESS; 

} 

Nous creons un fichier de motifs nomme datemsk.txt, qui contient plusieurs conversions 
possibles sur le theme de la date et de l'heure. Voici un exemple de quelques executions : 

$ cat datemsk.txt 

%F %ti:%H:%S 
%F SSH:%M 
i&F 

$ ./exemple_getdate 2000-01-14 

2000-01-14 : DATEMSK indefinie 

$ export DATEMSK=datemsk.txt 

$ ./exemple_getdate 2000-01-14 

2000-01-14 : Fri Jan 14 18:31:25 2000 

$ ./exemple_getdate "2000-01-14 05" 

2000-01-14 05 : Conversion impossible 

$ ./exemple_getdate "2000-01-14 05:06" 

2000-01-14 05:06 : Fri Jan 14 05:06:00 2000 

$ ./exemple_getdate "2000-01-14 05:06:07" 

2000-01-14 05:06:07 : Fri Jan 14 05:06:07 2000 

$ ./exemple_getdate "2000-04-31" 

2000-04-31 : Valeur invalide 

$ 
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La possibilite de modifier soi-meme le format des conversions est une fonctionnalite tres 
puissante. Indiquons toutefois que getdateO, ou plutot la fonction strptime( ) sous-jacente, 
n'est pas tres robuste vis-a-vis de la localisation, et que 1' application risque parfois de planter 
sur une faute de segmentation, notamment en employant les codes %r, %X ou %x. 



Figure 25.1 

Conversions de donnees 
d'horodatage 



gettimeofdayO 




inclusion 




localtimeQ 
gmtimeQ 



strptimeQ 
getdateQ 



La figure 25.1 recapitule toutes les routines de conversion que nous avons vues afin de passer 
d'une representation d'une date a une autre. 



Calcul d'intervalles 

Les fonctions que nous avons etudiees permettent de travailler sur un instant precis. Pourtant, 
il est parfois indispensable de travailler sur des durees, sur des intervalles. Nous pouvons par 
exemple avoir besoin d'ajouter a l'heure actuelle un delai maximal de reaction afin de 
programmer une alarme. 

Rappelons que les routines timeraddO, titnercl ear( ), timersubO et timerisset( ) , deja 
presentees dans le chapitre 9, permettent une manipulation facile des structures timeval, en 
garantissant que le membre tv_usec sera toujours compris entre 0 et 999 999, ce qui est obli- 
gatoire mais pas toujours facile a conserver. 

Le type timejt etant signe et contenant des secondes, il est possible d'ajouter ou de soustraire 
des durees sans probleme. Toutefois, si ce type de donnee devait evoluer, comme nous 1' avons 
evoque au debut de ce chapitre, certaines soustractions seraient peut-etre invalidees. Pour 
eviter ce genre de probleme, on peut utiliser la fonction difftime( ), qui permet de maniere 
portable de calculer l'intervalle entre deux instants donnes : 

double difftime (time_t instant_final , time_t instant_initial ) ; 

Le type de retour de cette fonction etant un doubl e, nous sommes assure qu'elle pourra gerer 
sans difficulte d'eventuelles extensions futures du type time_t. 
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Fuseau horaire 

Un systeme Unix en general et Linux en particulier est fonde sur la notion de reseau, de fonc- 
tionnement multi-utilisateur et de connexion a l'lnternet. Une machine donnee doit pouvoir 
accepter simultanement des utilisateurs provenant de plusieurs continents, residant dans des 
fuseaux horaires totalement differents. 

Traditionnellement, les stations Unix utilisent une horloge interne fonctionnant sur la refe- 
rence TU. II est done preferable autant que possible de laisser 1' horloge CMOS du PC 
travailler avec l'heure GMT. L'administrateur de la machine la configure alors pour indiquer 
dans quel fuseau horaire elle est installee physiquement, et le noyau peut ainsi horodater ses 
messages, par exemple avec l'heure locale. Malheureusement, pour cause de cohabitation 
avec d'autres systemes d' exploitation moins performants, il est souvent necessaire de laisser 
l'horloge interne tourner sur la reference locale. Les distributions Linux permettent de gerer 
ce type de desagrement. 

De son cote, un utilisateur peut se connecter sur la machine depuis n'importe quel endroit du 
monde, et il est normal que le systeme lui fournisse des informations temporelles adaptees a 
son environnement. Ceci conceme bien entendu le resultat de la commande date, mais egale- 
ment les horodatages des fichiers affiches par 1 s, ou les informations contenues dans l'en-tete 
des messages electroniques. 

Pour simplifier la tache de l'utilisateur, une seule variable d'environnement sert pour toutes 
ces operations : TZ. Celle-ci doit contenir le nom du fuseau horaire oil se trouve l'utilisateur, 
et toutes les informations de dates et d'heures seront mises a jour automatiquement au 
moment de l'affichage. 

En fait, les fonctions localtimeO, mktimeO, ctimeO ou strftimeO appellent automatique- 
ment la routine tzset( ), qui sert a initialiser les donnees correspondant a 1' emplacement de 
l'utilisateur : 

void tzset(void); 

II n'y a normalement pas de raison de faire appel directement a cette routine puisqu'elle est 
invoquee par toute fonction prenant en compte la position horaire. tzset( ) configure egale- 
ment deux chaines de caracteres globales : 

char * tzname [2] ; 

La chaine tzname [0] contient le nom du fuseau horaire, determine depuis la variable d'envi- 
ronnement TZ. La chaine tzname [1] comprend le nom de ce fuseau lorsqu'on bascule en 
heure d'ete. 

La variable d'environnement TZ peut etre remplie avec plusieurs champs successifs, seul le 
premier etant obligatoire : 

• Un nom de fuseau horaire, sur trois caracteres au minimum. 

• Un decalage qui indique la valeur a ajouter a l'heure TU pour obtenir l'heure locale. La 
valeur est positive a l'ouest de Greenwich. 

• Le nom du fuseau a utiliser pour l'heure d'ete. 

• Le decalage pour l'heure d'ete. 

• La date de debut de l'heure d'ete, indiquee sous l'une des formes suivantes : un J suivi du 
numero du jour dans l'annee, sans compter le 29 fevrier, meme pour les annees bissextiles, 
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un simple numero de jour, comptant eventuellement le 29 fevrier, ou un M suivi du numero 
du mois, puis d'un point, du numero de la semaine, d'un point, et du numero du jour de la 
semaine (le 0 etant le dimanche). 

• La date de fin de l'heure d'ete. 

Les informations concernant les fuseaux horaires preprogrammes sont stockees dans les 
repertoires /usr/1 ib/zonei nfo ou /usr/share/zoneinfo suivant les distributions Linux. 

Le programme suivant va afficher quelques exemples de configuration : 
exemplejzname.c : 

#include <stdio.h> 
#include <time.h> 

int 
main (void) 

{ 

tzset (); 

fprintf (stdout, "tzname[0] = £s\n", tzname[0] ) ; 
fprintf (stdout, "tzname[l] = £s\n", tzname[l]); 
return EXIT_SUCCESS; 

} 

Nous executons le programme qui suit en utilisant d'abord le fuseau horaire de Paris (CET), 
puis celui de Montreal. 

$ date 

lun jan 17 23:33:05 CET 2000 
$ Is -1 exemple_tzname.c 

-rw-rw-r-- 1 ccb ccb 190 Jan 17 23:22 exemplejzname.c 

$ ./exemple_tzname 
tzname[0] = CET 
tzname[l] = CEST 
$ export TZ=EST 
$ date 

lun jan 17 17:33:34 EST 2000 
$ Is -1 exemple_tzname.c 

-rw-rw-r-- 1 ccb ccb 190 Jan 17 17:22 exemplejzname.c 

$ ./exemple_tzname 
tzname[0] = EST 
tzname[l] = EDT 
$ 

Nous pouvons faire un essai en inventant notre propre fuseau horaire : 

$ export TZ="" 
$ date 

lun jan 17 22:35:49 UTC 2000 
$ ./exemple_tzname 
tzname[0] = UTC 
tzname[l] = UTC 
$ export TZ="RIEN -1:12" 
$ date 

lun jan 17 23:47:59 RIEN 2000 
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$ ./exemple_tzname 

tzname[0] = RIEN 
tzname[l] = RIEN 

Les possibilites de configuration du fuseau horaire utilisateur par utilisateur (et meme session 
par session) offrent des perspectives tres interessantes en ce qui concerne les fonctionnalites 
de communications internationales, aussi bien pour le courrier electronique que pour les 
groupes de discussion, en permettant a chacun d'obtenir des informations temporelles intelli- 
gibles dans son propre environnement, sans avoir a s'interroger sur la position precise de ses 
interlocuteurs. 

Conclusion 

Nous avons examine en detail l'essentiel des fonctionnalites d'horodatage offertes par Linux 
et la GlibC. 

Insistons encore sur la necessite de mettre 1' accent des a present sur la portabilite des 
programmes qui manipulent des donnees de type time_t et sur le risque d' evolution de celui- 
ci dans Favenir. 

Le lecteur interesse pourra trouver des elements complementaires sur les notions de calen- 
driers, de dates et d'heures, ainsi que sur les secondes de rattrapage periodique dans les FAQ 
du groupe Usenet sci .astro. 
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du systeme 



Les informations concernant Fetat du systeme, les groupes et les utilisateurs inscrits, les 
systemes de fichiers montes ou les derniers evenements survenus sont principalement utili- 
sees dans des applications de configuration (ajout ou suppression d' utilisateurs par exemple) 
et dans des utilitaires de surveillance du systeme a destination de l'administrateur. 

Dans la plupart des cas, un petit logiciel sert a encadrer l'appel-systeme ou la fonction de 
bibliotheque correspondante, et les fonctionnalites de haut niveau sont assurees par un ou 
plusieurs scripts shell. 

Nous allons examiner les fonctions offertes par le noyau et la bibliotheque C pour consulter 
ou configurer toutes ces donnees generates sur le parametrage du systeme. Comme la plupart 
de ces donnees sont conservees dans des fichiers systeme a peu pres similaires, nous verrons 
que les fonctions presentees dans ce chapitre suivent une inspiration commune. 

Groupes et utilisateurs 

Les informations concernant les groupes et les utilisateurs inscrits sur le systeme sont assez 
largement employees. Bien entendu ceci concerne les utilitaires permettant de gerer la liste 
des utilisateurs, mais egalement les applications de communication, la redaction de courrier 
electronique, les ecrans de connexion graphique au systeme X-Window, ou tout simplement 
Faffichage en clair des noms du proprietaire et du groupe d'un fichier. 

Fichier des groupes 

Les groupes d' utilisateurs sont enregistres sous Linux dans le fichier /etc/group. Ce fichier 
contient une ligne pour chaque groupe, avec les champs suivants separes par des deux-points : 
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• Nom du groupe. 

• Mot de passe. Ce champ n'est plus utilise pour les groupes. On le laisse generalement vide, 
d'autant qu'il n'est pas defini par Posix. 

• GID du groupe, sous forme decimale. 

• Liste des noms des utilisateurs appartenant au groupe, separes par des virgules. 
Voici un extrait d'un fichier /etc/group : 

$ cat /etc/group 

root: :0:root 

bin: :l:root, bin, daemon 

daemon: :2:root, bin, daemon 

nobody: :99: 

users: : 100 : Jennifer, mina, so 
$ 

Un meme nom pouvant etre indique en troisieme argument dans plusieurs lignes du fichier 
/etc/group, cela permet la configuration des groupes supplementaires de Futilisateur. 

La consultation directe du fichier /etc/group est bien entendu deconseillee pour garantir une 
certaine portabilite du programme vers des systemes employant d'autres methodes. La biblio- 
theque C offre ainsi un certain nombre de fonctions de manipulation des groupes. Une partie 
de ces fonctions renvoie des donnees allouees statiquement ; elles disposent a present 
d'homologues reentrantes, adaptees a une utilisation dans un contexte multithread. 

Pour traiter le contenu des entrees presentes dans le fichier des groupes, on utilise une struc- 
ture group, definie dans <grp.h> : 



Nom 


Type 


Signification 


gr_name 


char * 


Nom du groupe 


gr_gid 


gid_t 


GID du groupe 


gr_mem 


char ** 


Table contenant les noms des utilisateurs, le dernier element etant un pointeur NULL 



Les fonctions getgrnamO et getgrgidO - ainsi que getgrnam_r( ) et getgrgid_r() -permet- 
tent d'obtenir une structure group a partir d'un nom ou d'un GID. 

struct group * getgrnamtconst char * nom); 

int getgrnam_r (const char * nom, struct group * retour, 

char * buffer, size_t taille_buffer, 

struct group ** pointeur_resultat) ; 
struct group * getgrgid(gid_t gid); 
int getgrgid_r (gid_t gid, struct group * retour, 

char * buffer, size_t taille_buffer, 

struct group ** pointeur_resultat) ; 

Les fonctions getgrnam( ) et getgrgid( ) renvoient un pointeur sur une zone de memoire allouee 
statiquement ou un pointeur NULL si aucune entree n'a ete trouvee. Le fonctionnement de 
getgrnam_r( ) et de getgrgid_r( ) est legerement plus complique du fait qu'il faut fournir un 
espace pour stocker les chaines de caracteres sur lesquelles la structure regroupe des pointeurs : 
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• La structure group sur laquelle on passe un pointeur en second argument est remplie avec 
les donnees lues. 

• Le buffer passe en troisieme argument, dont la taille est indiquee a la suite, est utilise pour 
stocker les chaines de caracteres correspondant aux champs gr_name et gr_mem de la struc- 
ture group. Si le buffer est trop petit, la fonction echoue et le code d'erreur ERANGE est 
inscrit dans la variable globale errno. 

• Finalement, le pointeur transmis en dernier argument est rempli avec un pointeur sur la 
structure group passee en deuxieme argument, ou avec NULL en cas d'echec. 

La valeur de retour de getgrnam_r( ) et getgrgid_r( ) est nulle si elles reussissent. 

Parfois, on peut etre amene a examiner F ensemble des groupes de finis sur la machine, ne 
serait-ce que dans le cadre d'un utilitaire d'aide a 1' administration systeme. Dans ce cas, les 
fonctions getgrent( ) et getgrent_r( ) permettent de lire sequentiellement tous les enregistre- 
ments du fichier des groupes. 

struct group * getgrent (void); 

int getgrent_r (struct group * retour, 

char * buffer, size_t taille_buffer, 

struct group ** pointeur_resultat) ; 

Ces fonctions utilisent de maniere interne un flux correspondant au fichier /etc/group. Lors 
de la premiere invocation de getgrent( ) , ce flux est ouvert, puis les lignes sont analysees 
successivement a chaque appel. En fin de fichier, getgrent () renvoie un pointeur NULL, et 
getgrent_r( ) une valeur non nulle. Toutefois, on peut avoir besoin de revenir volontairement 
au debut du fichier des groupes. II existe deux fonctions, setgrent( ) et endgrent( ), qui ont un 
fonctionnement antagoniste, mais avec finalement le meme resultat : 

void setgrent (void) ; 
void endgrent (void) ; 

La fonction setgrent( ) ouvre le flux interne utilise par getgrent( ) et getgrent_r( ). Si le flux 
est deja ouvert, sa position de lecture est ramenee au debut. Si setgrent( ) n'est pas appelee 
explicitement, la premiere invocation de getgrent () le fera automatiquement. La fonction 
endgrent( ) referme le flux interne. En consequence, l'une et Fautre de ces fonctions ont pour 
resultat de faire reprendre la prochaine lecture au debut du fichier. 

II est parfois necessaire de consulter les donnees se trouvant dans un autre fichier que /etc/ 
group. Meme si ce genre de situation est rare, on peut la rencontrer par exemple lorsqu'on 
administre un systeme distant dont la partition /etc est montee par NFS dans un autre empla- 
cement de notre arborescence. Cette situation se presente aussi pour des raisons de securite 
lorsqu'un repertoire est employe comme racine - avec l'appel chroot( ) - pour un processus 
particulier (comme /home/ftp). 

Pour cela on dispose des fonctions fgetgrentO et fgetgrent_r( ), qui permettent de lire 
depuis un flux qu'on ouvre et qu'on ferme normalement avec f open( ) et f cl ose( ). 

struct fgetgrent (FILE * flux); 

struct fgetgrent_r (FILE * flux, struct group * retour, 
char * buffer, size_t taille_buffer, 
struct group ** pointeur_resultat) ; 

Ces deux routines fonctionnent exactement comme getgrent( ) et getgrent_r( ), en se servant 
simplement du flux transmis en premier argument plutot que de le gerer elles-memes. 
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On notera l'existence d'une fonction de bibliotheque nommee initgroups( ), qui sert a 
consulter le fichier des groupes et a initialiser la liste des groupes supplementaires d'un utili- 
sateur donne. 

int initgroups (const char * nom, gid_t gid); 

Cette routine est privilegiee car elle invoque setgroups( ) , que nous avons etudiee dans le 
chapitre 2, et qui reclame la capacite CAP_SETGID. Cette fonction est appelee lors de la 
connexion d'un utilisateur par l'utilitaire /bin/1 ogin, ainsi que par /bi n/su. On ne l'invoque 
normalement pas dans une application courante. 

Fichier des utilisateurs 

Comme le fichier des groupes, celui des utilisateurs est stocke dans le repertoire /etc. Typi- 
quement, il s'agit du fichier /etc/passwd. Ce dernier est accessible en lecture pour tous les 
utilisateurs du systeme (ceci est necessaire par exemple pour trouver le nom reel d'un utilisa- 
teur a partir de son UID). Toutefois, le mot de passe y apparait de maniere cryptee, comme 
nous en avons parle dans le chapitre 16. L' evolution des processeurs rend a present possible la 
recherche de mots de passe par force brute, en cryptant successivement tout le dictionnaire 
pour decouvrir la chaine chiffree correspondant a celle du fichier /etc/passwd. Pour cette 
raison, la plupart des systemes Linux utilisent a present la technique des shadow passwords. 
Le mot de passe crypte n'est plus stocke dans / etc/passwd mais dans un autre fichier, comme 
/etc/shadow, accessible en lecture uniquement par un processus ayant un UID nul. 

Le fichier contient une ligne pour chaque utilisateur, avec un certain nombre de parametres. 
Pour manipuler ces enregistrements, on utilise la structure passwd, definie dans <pwd . h> : 



Nom 


Type 


Signification 


pw_name 


char * 


Nom de I'utilisateur, tel qu'il est employe pour la connexion. 


pw_passwd 


char * 


Mot de passe crypte. 


pw_uid 


uid_t 


UID de I'utilisateur. 


pw_gid 


gid_t 


GID principal de I'utilisateur. 


pw_gecos 


char * 


Commentaires sur I'utilisateur. 


pw_d 1 r 


char * 


Repertoire personnel de I'utilisateur. 


pw_shel 1 


char * 


Le shell employe lors de la connexion de I'utilisateur. 



Nous pouvons relever quelques points : 

• Le membre pw_passwd n'est pas significatif sur les systemes employant les shadow 
passwords. Si vous desirez ecrire une application qui s'assure de l'identite d'un utilisateur 
en verifiant son mot de passe, il faut que celle-ci puisse acceder au fichier /etc/shadow 
plutot que /etc/passwd, et qu'elle puisse y lire les enregistrements. 

• Le champ pw_gid correspond au groupe principal de I'utilisateur. L'acces aux GID de ses 
groupes supplementaires est possible avec la fonction getgroupsO, que nous avons vue 
dans le chapitre 2. 

• Le champ pw_gecos peut contenir des informations plus ou moins pertinentes suivant les 
habitudes d' administration sur le systeme. Dans certains cas, il est vide ou ne comprend 
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que le nom complet de l'utilisateur. A F oppose, on peut rencontrer des systemes oil ce 
champ est lui-meme scinde en plusieurs sous-enregistrements separes par des virgules 
comportant adresse, numero de telephone, numero de fax, etc. 

• Le repertoire personnel de l'utilisateur indique dans pw_di r est normalement accessible en 
lecture, parcours et ecriture par l'utilisateur. Pour certains comptes particuliers (connexion 
PPP entrante par exemple), il peut s'agir d'un repertoire uniquement accessible en parcours, 
voire de la racine du systeme de fichiers. 

• De meme, le shell employe pour la connexion, indique dans le champ pw_shel 1 , peut dans 
certains cas particuliers etre un programme special (/shin/shutdown par exemple). 

L' acces a la structure passwd s'obtient par le biais de fonctions qui ressemblent largement a 
celles que nous avons rencontrees pour les groupes d'utilisateurs. Pour avoir l'entree corres- 
pondant a un utilisateur donne, getpwuid( ) et getpwnam( ) permettent des recherches respec- 
tive ment sur l'UID ou le nom de connexion. Leurs versions reentrantes, getpwuid_r() et 
getpwnam_r( ), fonctionnent sur le meme modele que celui qui a ete decrit pour getgrnam_r( ). 

struct passwd * getpwuid (uid_t uid); 

int getpwuid_r (uid_t uid, struct passwd * retour, 

char * buffer, size_t taille_buffer, 

struct passwd ** pointeur_resultat) ; 
struct passwd * getpwnam (const char * nom); 
int getpwnam_r (const char * nom, struct passwd * retour, 

char * buffer, size_t taille_buffer, 

struct passwd ** pointeur_resultat) ; 

Lorsqu'on veut balayer tout le fichier des utilisateurs, on peut utiliser la fonction getpwent( ) 
ou sa cousine reentrante, getpwent_r( ). 

struct passwd * getpwent (void); 

int getpwent_r (struct passwd * retour, 

char * buffer, size_t taille_buffer, 

struct passwd ** pointeur_resultat) ; 

Pour reinitialiser la lecture sequentielle du fichier des utilisateurs, on a le choix entre 
setpwent( ) , qui ouvre le flux interne, ou endpwent( ) , qui le ferme. 

void setpwent (void) ; 
void endpwent (void) ; 

Quand on desire travailler avec un autre fichier que /etc/passwd (notamment /etc/shadow ou 
/home/ftp/etc/passwd), on emploie les fonctions fgetpwentO ou fgetpwent_r( ) en leur 
transmettant le pointeur de flux correspondant au fichier deja ouvert. 

struct passwd * fgetpwent (FILE * flux); 

int fgetpwent_r (FILE * flux, struct passwd * retour, 

char * buffer, size_t taille_buffer, 

struct passwd ** pointeur_resultat) ; 

La fonction putpwent( ) permet de creer un enregistrement dans un fichier d'utilisateurs dont 
on lui fournit un pointeur de flux. L'emploi de cette routine est deconseille car elle ajoute 
simplement 1' enregistrement, sans verifier s'il existait auparavant. Finalement, les applica- 
tions devant modifier le fichier des mots de passe (comme /usr/bin/passwd bien entendu, 
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mais aussi des utilitaires comme /usr/bi n/chsh) devront etre installees Set-UID root et modi- 
fieront directement le fichier. 

int putpwent (const struct passwd * passwd, FILE * flux); 

Une fonctionnalite importante du fichier des mots de passe concerne l'obtention du nom de 
connexion de l'utilisateur ayant lance le processus courant. En realite, les fonctions 
getl ogin( ) et getlogin_r( ) donnent acces au nom de l'utilisateur connecte sur le terminal de 
controle du processus. Ces routines, a la difference des precedentes, sont declarees dans 
<unistd. h> : 

char * getlogin (void) ; 

int getlogin_r (char * buffer, size_t taille_buffer) ; 

La fonction cuseridO fournit le nom de l'utilisateur correspondant a l'UID effectif du 
processus appelant. Elle est declaree dans <stdio.h> : 

char * cuserid (char * nom); 

Si le buffer transmis en argument n'est pas NULL, il doit faire au moins L_cuserid octets de 
long, et le nom y est stocke. Sinon, la fonction renvoie un pointeur sur une zone de memoire 
allouee statiquement. 



Attention 

Cette routine n'est pas portable ; elle est implemented differemment sur d'autres Unix. Elle est considered 
desormais comme obsolete. 

Fichier des interpreteurs shell 

II existe normalement un fichier /etc/shel 1 s, qui contient, ligne par ligne, la liste des inter- 
preteurs de commandes disponibles. En voici un exemple sur une distribution Red Hat : 

$ cat /etc/shells 

/bin/bash 

/bin/sh 

/bin/ash 

/bin/bsh 

/bin/tcsh 

/bin/csh 

/bin/ksh 

/bin/zsh 

$ 

Cette liste est employee principalement par l'utilitaire /usr/bi n/chsh et par les programmes 
d'aide a 1' administration systeme pour ajouter un utilisateur. Pour lire le contenu de ce fichier, 
les fonctions getusershel 1 ( ), setusershel 1 ( ) et endusershel 1 ( ) sont declarees dans 
<uni std . h> : 

char * getusershell (void); 
void setusershell (void); 
void endusershell (void); 



Acces aux informations du systeme 

Chapitre 26 



Comme nous l'avons deja observe avec le fichier des groupes et celui des utilisateurs, la fonc- 
tion getusershel 1 ( ) permet de lire le fichier des shells sequentiellement. setusershel 1 ( ) et 
endusershel 1 ( )ramenent quant a elles la position de lecture au debut. 

Un utilisateur n'est pas force de choisir son shell de connexion dans cette liste. Par exemple, 
dans le cas d'un nom utilise pour mettre en place une connexion PPP entrante, le programme 
de connexion indique dans le fichier des utilisateurs pourra etre /usr/sbin/pppd. On notera 
egalement que si le fichier des shells n'est pas accessible, getusershel 1 ( ) se comporte 
comme si celui-ci contenait les lignes /bin/sh et /bin/csh. 

Nom d'hote et de domaine 

Nom d'hote 

Le nom d'hote est principalement employe pour identifier le systeme lors d'un dialogue avec 
un utilisateur humain. Ce nom ne sert generalement pas lors des communications entre ordi- 
nateurs, oil on utilise plutot des identifications numeriques comme l'adresse IP ou l'adresse 
MAC. Pour obtenir le nom de la machine sur laquelle une application se deroule, on emploie 
la fonction gethostname( ). La routine privilegiee sethostname( ) sert a configurer le nom 
d'hote. Elle est generalement invoquee une seule fois dans un script de demarrage par le biais 
de l'utilitaire /bin/hostname qui lui sert d'interface. 

int gethostname (char * buffer, size_t taille); 
int sethostname (char * buffer, size_t taille); 

La taille du buffer contenant le nom est transmise en seconde position. Si le buffer est trop 
petit pour recevoir la chaine de caracteres, gethostnatne( ) echoue avec l'erreur ENAMETOOLONG. 

Le nom d'hote qu'on manipule avec gethostname( ) ou sethostname( ) doit etre complet, 
c'est-a-dire qu'il doit contenir le domaine en entier. En voici un exemple d'utilisation : 

exemple_gethostname.c : 

#include <errno.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

int 
main (void) 

{ 

char * buffer = NULL; 
size_t taille = 8; 

buffer = malloc(taille) ; 

while (gethostnametbuffer, taille) != 0) { 
if (errno != ENAMETOOLONG) { 
perror( "gethostname" ) ; 
exit(EXIT_ FAILURE); 

1 

taille += 8; 

buffer = realloctbuffer, taille); 
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} 

fprintf (stdout, "Zs\n". buffer); 
f ree(buffer) ; 
return EXIT_SUCCESS; 

} 

Nous pouvons verifier que le nom de la machine est bien complet : 

$ . /exemple_gethostname 

venux.logilin.fr 
$ 

Lorsqu'on utilise l'appel-systeme sethostnatne( ), on signale simplement en second argument 
la longueur du nom, telle qu'elle est fournie par strl en( ). Si ce nom est trop long, la fonction 
renvoie l'erreur EINVAL dans errno. Pour etre autorise, le changement de nom d'hote doit etre 
realise par un processus ayant la capacite CAP_SYS_ADMIN. 

Nom de domaine 

Parallelement, il existe deux appels-systeme, getdomainnameO et setdomainname( ), qui 
permettent d'obtenir et de configurer le nom du domaine auquel appartient la machine. 

int getdomai nname (char * buffer, size_t taille); 
int setdomai nname (char * buffer, size_t taille); 

En fait, getdomai nname( ) n'est plus un appel-systeme sous Linux, il a ete remplace par une 
fonction de bibliotheque qui utilise l'appel uname( ). On notera que getdomai nname( ) renvoie 
toujours une chaine vide si on ne prend pas le systeme NIS pour determiner le domaine. Sur 
la plupart des stations Linux autonomes, cette fonction n'est done pas utile. 

Identifiant d'hote 

Pour essayer d' identifier une machine de maniere unique, la bibliotheque C definit deux fonc- 
tions, gethostid( ) et sethostid( ). La seconde est une fonction privilegiee qui enregistre l'iden- 
tifiant qu'on lui transmet dans un fichier (generalement /var/adm/hostid). Lorsque gethostid( ) 
est invoquee sans qu'on ait appele sethostidt ) auparavant, elle utilise l'adresse IP de la pre- 
miere interface reseau de la machine. Si cette operation se revele impossible, elle renvoie 0. 

long int gethostid (void); 

int sethostid (long int identifiant); 

L identifiant peut, sur certains systemes autres que Linux, etre construit directement a partir 
de l'adresse MAC de l'interface reseau. 

Informations sur le noyau 

Identification du noyau 

II peut etre utile dans une application d' identifier la version du noyau en cours d' execution 
(par exemple pour tirer parti de certaines nouvelles fonctionnalites ou pour eviter un bogue 
present dans une ancienne version). L'appel-systeme unameO permet d'obtenir plusieurs 
renseignements sur le systeme. 

int uname (struct utsname * utsname); 
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Les informations sont stockees dans une structure utsname definie dans <sys/utsname.h>, et 
dont tous les membres sont du type char * : 



Nom 


Signification 


sysname 


Nom du systeme (Sexploitation . Pour nous, « Linux ». 


nodename 


Nom complet de la machine, comme avec gethostnamet ). 


rel ease 


Numero de version du noyau. 


version 


Numero de revision du noyau au sein de la version courante. 


machine 


Type de machine. II s'agit du nom du processeur suivi de celui du fabricant de I'ordinateur. Ce 
dernier nom n'est pas toujours disponible ; on obtient souvent quelque chose comme « i 686- 
unknown ». 


domainname 


Nom du domaine auquel appartient la machine, comme dans getdomainnamet ). Pour que ce 
champ soit disponible, il taut definir la constante symbolique _GNU_SOURCE avant inclusion de I'en- 
tete <sys/utsname.h>. 



Voici un programme simple permettant de visualiser les differents champs : 
exemplejjname.c : 

#define _GNU_SOURCE 
^include <stdio.h> 
#include <sys/utsname. h> 



int 
main (void) 

{ 

struct utsname utsname; 
uname(& utsname) ; 

fprintf (stdout, " sysname = Is \n nodename = %s \n" 
" release = %s \n version = %s \n" 
" machine = %s \n domaine = %s \n", 

utsname. sysname, 

utsname. nodename, 

utsname. release, 

utsname. version, 

utsname. machine, 

utsname. domainname) ; 
return EXIT_SUCCESS; 

} 

Et voici un exemple d' execution : 

$ ./exemple_uname 

sysname = Linux 

nodename = venux.logilin.fr 

release = 2.6.9 

version = #2 Tue Jan 4 13:05:35 CET 2005 
machine = i 686 
domaine = 

$ 
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Informations sur I'etat du noyau 

II est rare dans un cadre applicatif d' avoir reellement besoin d'obtenir des renseignements 
pointus sur I'etat du systeme. Toutefois, cela est possible sous Linux a l'aide de 1' appel- 
systeme sysinfoO, declare dans <sys/sysinfo.h> : 

int sysinfo (struct sysinfo * info); 

Cet appel-systeme n'est absolument pas portable sur d'autres systemes que Linux. La struc- 
ture sysinfo qu'il remplit est definie dans <1 i nux/ kernel . h> avec les membres suivants : 



Norn 


Type 


Signification 


uptime 


Long 




Nombre de secondes ecoulees depuis le boot de la machine 


1 oads 


unsigned 


long [3] 


Charge systeme durant les 1, 5 et 10 dernieres minutes, 
65 535 correspondant a 1 00 % 


f reeram 


unsigned 


long 


Memoire libre, exprimee en octets 


sharedram 


unsigned 


long 


Memoire partagee entre plusieurs processus 


buf ferram 


unsigned 


long 


Memoire utilisee pour les buffers du noyau 


total swap 


unsigned 


long 


Taille totale du peripherique de swap, en octets 


f reeswap 


unsigned 


long 


Quantite disponible sur le peripherique de swap 


procs 


unsigned 


short 


Nombre de processus en cours d'execution 



Le programme suivant met en oeuvre 1' appel-systeme sysi nf o( ), a la maniere des utilitaires 
/usr/bin/uptime ou /usr/bin/top. 

exemple_sysinfo.c : 

//include <stdio.h> 
//include <sys/sysinfo.h> 
//include <1 inux/kernel .h> 

int 
main (void) 
{ 

struct sysinfo info; 

if (sysinfo(& info) != 0) { 

perrorCsysinfo"); 

exit(EXIT_FAILURE); 

} 



fprintf (stdout, "Nb secondes depuis boot 




%ld \n", 


info. uptime) ; 






fprintf (stdout, "Charge systeme depuis 1 


mn 


%.Zf%%\n" 


info.loads[0] / 655.36); 






fprintf (stdout, " 5 


mn 


%.Zf%%\n" 


info.loads[l] / 655.36); 






fprintf (sdout, " 10 


mn 


%.Zf%%\n" 


info.loads[2] / 655.36); 






fprintf (stdout, "Memoire disponible 




%1d Mo\n" 


info.freeram >> 20) ; 
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fprintf (stdout, "Memoire partagee : %ld Mo\n" 

info.sharedram >> 20); 
fprintf (stdout, "Memoire dans buffers : %ld Mo\n" 

info.bufferram >> 20); 
fprintf (stdout, "Espace de swap total : %ld Mo\n" 

info.totalswap >> 20); 
fprintf (stdout, "Espace de swap libre : %ld Mo\n" 

info.f reeswap >> 20); 
fprintf (stdout, "Nb processus en cours : %d \n", 

info.procs) ; 
return EXIT SUCCESS; 



Rappelons que cet appel-systeme est specifique a Linux et qu'il ne sera pas disponible sur 
d'autres architectures. 

$ ./exemple_sysinfo 



Nb secondes depuis boot 




170191 


Charge systeme depuis 


1 


mn 


1.202 




5 


mn 


0.052 




10 


mn 


0.011 


Memoire disponible 






5 Mo 


Memoire partagee 






0 Mo 


Memoire dans buffers 






138 Mo 


Espace de swap total 






509 Mo 


Espace de swap libre 






509 Mo 


Nb processus en cours 






59 



Systeme de fichiers 

Un systeme Linux normal gere au minimum deux partitions physiques : l'une constitue la 
racine de Farborescence du systeme de fichiers et 1' autre est utilisee comme peripherique de 
swap. On emploie egalement d'autres systemes de fichiers pour acceder aux peripheriques 
amovibles, comme les lecteurs de CD-Rom ou les disquettes. II peut aussi etre interessant de 
se servir de plusieurs partitions physiques differentes sur le disque, qu'on monte a differents 
endroits du systeme de fichiers. Ceci permet par exemple d'utiliser un espace disque limite et 
fige pour les repertoires ne devant pas evoluer sensiblement (/, /bin, /etc, /dev, /usr), et de 
laisser le reste de la capacite disponible pour les zones susceptibles de subir des modifications 
importantes (/home, /tmp). On peut egalement utiliser un decoupage du disque en plusieurs 
partitions pour simplifier les travaux de sauvegardes systematiques en isolant les donnees 
modifiees frequemment de celles qui n'evoluent pas une fois le systeme installe. Lorsqu'on 
administre un pare de plusieurs stations Unix, il est tres important qu'un utilisateur puisse 
disposer de son environnement de travail personnel quelle que soit la machine devant laquelle 
il s'assoit. On organise alors une distribution des repertoires personnels /home/xxx sur 
F ensemble des machines, avec un montage au travers du reseau par le protocole NFS. 

Enfin, on peut etre amene a personnaliser le partitionnement pour des besoins specifiques. A 
titre d'exemple, je peux citer un cas oil je devais installer des stations Linux dans un environ- 
nement de production assez perilleux, sujet a de frequents problemes de distribution electrique 
et a des manipulations pour le moins maladroites. J'ai decide d'employer un montage en lecture 
seule de tous les repertoires systeme (/usr, /etc, . . .). Les donnees propres a 1' utilisateur ainsi 
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que les fichiers de configuration susceptibles de changer se trouvaient dans des repertoires 
(/home et /usr/local) montes par NFS depuis un serveur administre par une equipe de main- 
tenance operationnelle. Enfin, une partition reformatee a chaque demarrage de la machine 
regroupait les fichiers a faible duree de vie dans /trap. L'avantage d'une telle organisation etait 
de permettre un arret brutal de la machine sans risque de perte de donnees. 

Caracteristiques des systemes de fichiers 

Pour simplifier le travail de radministrateur - afin d'autoriser l'insertion de peripheriques 
amovibles par n'importe quel utilisateur et permettre le montage automatique de certaines 
partitions au demarrage de la machine -, on etablit la liste des systemes de fichiers disponi- 
bles et on la stocke dans /etc/fstab. II sera alors possible de rattacher une partition au 
systeme de fichiers simplement en invoquant une commande du type : 

$ mount /mnt/cdrom 
$ mount /mnt/dos 
$ mount /mnt/f loppy 

De plus, les gestionnaires graphiques de fichiers sauront monter ou demonter les nceuds 
correspondant en consultant cette table. Chaque ligne du fichier /etc/fstab contient les 
champs suivants, separes par des tabulations ou par des espaces. 

• Nom du fichier special en mode bloc representant le peripherique (par exemple /dev/hdal 
pour une partition disque IDE, /dev/fdO pour le premier lecteur de disquette, etc.). Pour les 
pseudo-systemes de fichiers comme /proc, on indique souvent le mot-cle none. Les reper- 
toires provenant d'un serveur NFS sont mentionnes en signalant le nom du serveur (ou son 
adresse IP), suivi d'un deux-points et du chemin d'acces au repertoire. Par exemple 
pingouin:/home/tux. 

• Le point de montage du systeme de fichiers dans F arborescence generale (par exemple / pour 
la partition racine, /mnt/cdrom ou /mnt/f 1 oppy pour des peripheriques amovibles, /home/ 
users pour un repertoire normal). Pour les partitions de swap, on utilise le mot-cle none. 

• Le type du systeme de fichiers. Le noyau Linux reconnait couramment les systemes mi ni x 
(heritage historique des premiers noyaux), ext (obsolete, a oublier), ext3 (le standard 
Linux actuel), ext2 (son predecesseur), iso9660 (pour les CD-Rom), udf (pour les DVD), 
swap, nfs, msdos, ntfs, et vfat (pour acceder aux partitions Dos ou Windows). On peut 
mentionner les pseudo systemes de fichiers proc (informations du noyau) et devpts 
(pseudo terminaux Unix 98 comme nous les etudierons dans le chapitre 33). II existe de 
nombreux autres systemes, moins utilises ou experimentaux, qui sont generalement dispo- 
nibles sous forme de modules du noyau. 

• Des options concernant le montage du systeme de fichiers. II existe des options generates, 
comme noauto qui empeche le montage automatique au demarrage (utile pour les periphe- 
riques amovibles), user qui autorise n'importe quel utilisateur a monter le systeme de 
fichiers, ro qui demande un montage en lecture seule, ou mand qui permet les verrouillages 
stricts, comme nous l'avons vu au chapitre 19. II y a aussi des options specifiques pour 
chaque type de systeme. On consultera au besoin les pages de manuel mount(8), fstab(5) 
et nfs(5) pour avoir des details supplementaires. 

• La frequence des sauvegardes de la partition par l'utilitaire dump. Cette option n'est gene- 
ralement pas utilisee, on la remplace par un zero. 
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• L'ordre de verification des systemes de fichiers au demarrage de la machine. Si ce champ 
est absent ou mil, la partition n'est pas verifiee. Sinon, le programme fsck traite les 
systemes de fichiers sequentiellement dans l'ordre indique. Normalement, la partition 
racine doit etre configured avec la valeur 1, et les autres avec la valeur 2. Si les partitions 
sont gerees par des controleurs de disque distincts, elles sont verifiees en parallele. 

Voici un extrait d'un tel fichier : 



$ cat /etc/fstab 










/dev/hda5 


/ 


ext3 


defaul ts ,mand 


0 


1 


/dev/hda6 


swap 


swap 


defaul ts 


0 


0 


/dev/fdO 


/mnt/f 1 oppy 


vfat 


noauto.user 


0 


0 


/dev/hdc 


/mnt/cdrom 


udf , i so9660 


noauto.ro, user 


0 


0 


/dev/hdal 


/mnt/dos 


vfat 


noauto.user 


0 


0 


none 


/dev/pts 


devpts 


gid=5,mode=620 


0 


0 


none 


/proc 


proc 


defaul ts 


0 


0 



$ 

Naturellement, il est toujours possible d'invoquer directement la commande mount avec toutes 
les options en ligne de commande, mais il est beaucoup plus agreable de n' avoir a saisir que 
mount /mnt/cdrom par exemple. II faut done accorder une grande importance a la redaction du 
fichier /etc/fstab, d'autant que cette tache d' administration n'a lieu qu'une seule fois, lors 
de l'installation du systeme (ou en cas d'ajout d'un nouveau peripherique). La bibliotheque C 
propose un ensemble de fonctions permettant de consulter ce fichier. Les routines setfsent( ) 
et endfsent( ) fonctionnent comme d'habitude en ouvrant ou en fermant le fichier /etc/fstab, 
ce qui a done pour consequence de faire reprendre la lecture suivante au debut. 

int setfsent (void) ; 
void endfsent (void) ; 

Pour manipuler les enregistrements, une structure f stab est definie dans <f stab . h> : 



Nom 


Type 


Signification 


f s_spec 


char * 


Nom du fichier special representant le peripherique concerne. Peut egalement etre un 
nom d'hote suivi d'un chemin d'acces pour les montages NFS. 


fs_file 


char * 


Point de montage dans I'arborescence du systeme de fichiers. 


f s_vf stype 


char * 


Type de systeme de fichiers. 


f s_mntops 


char * 


Options de montage, globales ou specifiques au type de systeme de fichiers employe. 


fs_type 


char * 


Mode d'acces a la partition montee (voir plus bas). 


f s_f req 


int 


Periode (en jours) entre deux sauvegardes (souvent inutilise). 


f s_passno 


int 


Ordre de verification de la partition au demarrage. 




Le champ f s_ 


_type peut contenir l'une des chaines de caracteres decrites dans le tableau suivant. 


Attention 

II s'agit bien de chaines de caracteres et non de constantes symboliques. II faut done les examiner avec 
strcmpt ). 
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onaine 


oiyniiiCaiion 


ro 1 AD_r\W 


ral LI 11 UN a IIIUI ILci cN IcOlUlc cL cOi UUIc (.pal cAcnipic / unpj 


FSTAB_RQ 


Partition a monter en lecture et ecriture avec un systeme de comptabilite par quotas 
(par exemple /home) 


FSTAB_R0 


Partition a monter en lecture seule (par exemple /usr) 


FSTAB_SW 


Partition de swap 


FSTAB_XX 


Partition ignoree 



La fonction getfsentO renvoie l'entree suivante du fichier, getfsspecO recherche l'entree 
dont le champ f s_spec (nom du fichier special de peripherique) correspond a la chaine trans- 
mise en argument. La fonction getfsfileO retourne quant a elle l'entree dont le membre 
f s_f i 1 e (point de montage) correspond a son argument. 

struct fstab * getfsent (void); 

struct fstab * getfsspec (const char * nom); 

struct fstab * getfsfile (const char * nom); 

Ces fonctions renvoient un pointeur sur une structure stockee dans une zone de memoire 
statique, ou NULL en cas d'echec. 

Pour connaitre l'etat des systemes de fichiers actuellement montes, un processus peut exa- 
miner le pseudo-fichier /proc/mounts mis a jour par le noyau. Toutefois, ceci n'est pas portable, 
et le format de ce fichier peut evoluer dans des versions futures de Linux. Pour simplifier cette 
tache, les utilitaires mount et umount mettent a jour une table, stockee generalement dans le 
fichier /etc/mtab, avec un format ressemblant a celui de /etc/f stab mais ne contenant que les 
partitions montees. 

Pour analyser ces donnees, on utilise une structure mntent definie dans <mntent.h>, dont les 
membres sont mieux nommes que ceux de fstab : 



Nom 


Type 


Signification 


mnt_f sname 


char * 


Nom du fichier special de peripherique (equivalent a f s_spec) 


mnt_di r 


char * 


Point de montage (equivalent a fs_f 1 1 e) 


mnt_type 


char * 


Le type du systeme de fichiers (equivalent a f s_vf stype) 


mnt_opts 


char * 


Options utilisees durant le montage (equivalent a f s_mntops) 


mnt_f req 


i nt 


Frequence de sauvegarde (equivalent a f s_f req) 


mnt_passno 


i nt 


Ordre de verification (equivalent a f s_passno) 



Les fonctions setmntent( ) et endmntent( ) permettent d'ouvrir et de fermer un flux en fournis- 
sant le nom du fichier. Ces routines rendent possible la manipulation de /etc/mtab mais 
egalement d'autres fichiers ayant le meme format, comme /etc/f stab ou /proc/mounts. 

FILE * setmntent (const char * nom, const char * mode); 
int endmntent (FILE * fichier); 

Les arguments de setmntent( ) sont identiques a ceux de fopen( ). 
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Attention 

Le pointeur de flux renvoye par setmntentO doit etre referme a I'aide de endmntent( ) et surtout pas 
avec f cl ose( ). 



La lecture peut se faire a I'aide de getmntent( ) , qui renvoie un pointeur sur une zone statique, 
ou avec getmntent_r( ), reentrante, qui utilise des arguments plus compliques, comme nous 
Favons deja observe avec getgrnam( ). Pour eviter les problemes de taille du buffer, il suffit 
que celui-ci soit suffisamment grand pour contenir la plus longue ligne du fichier. Les lignes 
d'un fichier /etc/mtab ne depassent generalement pas 80 caracteres. 

struct mntent * getmntent (FILE * fichier); 

struct mntent * getmntent_r (FILE * fichier, struct mntent * retour. 

char * buffer, int tail 1 e_buffer) ; 

Le programme suivant va utiliser getmntent_r( ) - bien que getmntent( ) aurait largement 
suffi dans ce contexte monothread - afin de consulter le fichier dont le nom est fourni en 
argument. 

exemple_mtab.c : 

#include <stdio.h> 
#include <mntent.h> 



int 

main (int argc, char * argv[]) 
{ 

struct mntent mtab; 
char buffer[256]; 
FILE * file; 



if (argc != 2) { 

fprintf (stderr, "%s <fichier mtab> \n", argv[0]); 
exi t( EX IT_FAI LURE ) ; 

} 

if ((file = setmntent(argv[l], "r")) == NULL) { 
perror( "setmntent" ) ; 
exi t( EX IT_FAI LURE ) ; 

} 

while (1) { 

if (getmntent_r(file, & mtab, buffer, 256) == NULL) 
break; 

fprintf (stdout, "fsname = %s \n dir = %s\n type = %s \n" 

" opts = Is \n freq = %d \n passno = %d \n", 
mtab.mnt_fsname, mtab.mnt_dir, 
mtab.mnt_type, mtab.mnt_opts, 
mtab.mnt_freq, mtab.mnt_passno) ; 

} 

endmntent(file) ; 
return EXIT_SUCCESS; 
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On peut utiliser ce programme sur /etc/fstab, /etc/mtab, /proc/mounts... 

$ ./exemple_mtab /proc/mounts 

fsname = /dev/root 
dir = / 
type = ext3 
opts = rw.mand 
freq = 0 
passno = 0 
fsname = /proc 
dir = /proc 
type = proc 
opts = rw 
freq = 0 
passno = 0 
fsname = none 
dir = /dev/pts 
type = devpts 
opts = rw 
freq = 0 
passno = 0 

$ 

II est aussi possible d'ajouter une nouvelle entree dans un fichier, a Faide de addmntent( ), qui 
permet d'ecrire une application incorporant des routines de montage et de demontage de 
systemes de fichiers tout en restant compatible avec l'utilitaire mount. On peut egalement 
employer ces routines pour creer un editeur de fichier /etc/fstab. Comme il n'existe pas de 
routine specialised, si on veut supprimer une ou plusieurs lignes, il faut recopier le fichier 
entree par entree, en sautant celles qu'on veut eliminer, et utiliser rename ( ) pour remplacer le 
fichier original. Naturellement, l'ajout d'enregistrements dans un fichier necessite l'ouverture 
en mode r+. 

int addmntent (FILE * fichier, const struct mntent * mntent); 

Pour analyser le champ mnt_opts de la structure mntent, il est conseille d'utiliser la routine 
getsuboptO que nous avons etudiee dans le chapitre 3. Toutefois, lorsqu'on desire simple- 
ment verifier la presence d'une option bien determinee dans une entree, on peut plutot choisir 
la fonction hasmntopt( ). 

char * hasmntopt (const struct mntent * mntent, const char * option); 

Si Foption indiquee en second argument se trouve dans le champ mnt_opts de la structure 
passee en premiere position, cette fonction renvoie un pointeur sur le premier caractere 
de cette option (dans la chaine mnt_opts). Sinon, elle transmet un pointeur NULL. Ainsi le 
programme suivant recherche les partitions mentionnees dans /etc/fstab qui possedent 
l'attribut mand autorisant un verrouillage strict des fichiers. 

exemplejiasmntopt.c : 

#include <stdio.h> 
#include <mntent.h> 



int 
main (void) 
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I 

FILE * fichier; 

struct mntent * mntent; 

fichier = setmntent( "/etc/fstab" , "r"); 
if (fichier == NULL) 

exi t( EX IT_FAI LURE ) ; 
while (1) { 

mntent = getmntent(fichier) ; 

if (mntent == NULL) 
break; 

if (hasmntopt(mntent, "mand") != NULL) 
fprintf (stdout, "%s (%s)\n", 
mntent->mnt_f sname , 
mntent->mnt_di r) ; 

} 

endmntent(fichier) ; 
return EXIT_SUCCESS; 

} 

On retrouve alors la partition racine de l'exemple precedent : 

$ ./exempl e_hasmntopt 

/dev/hda5 (/) 



Informations sur un systeme de fichiers 

Pour obtenir des informations concernant un systeme de fichiers particulier, s'il est monte, il 
est possible d'employer les appels-systeme statfsO ou fstatfsO. Le premier fournit des 
renseignements sur le systeme contenant le fichier (ou le repertoire) dont le nom est passe en 
argument. Le second appel-systeme utilise un descripteur de fichier, qui doit done avoir ete 
prealablement ouvert. 

int statfs (const char * fichier, struct statfs * staffs); 
int fstatfs (int descripteur, struct statfs * statfs); 

Les informations sont transmises dans une structure statfs, definie dans <sys/statf s . h> avec 
au minimum les membres suivants : 



Nom 


Type 


Signification 




f_type 


int 


Type de systeme de fichiers 




f_bsi ze 


int 


Taille de bloc 




f_bl ocks 


long 


Nombre total de blocs 




f_bf ree 


long 


Nombre de blocs libres 




f_bavai 1 


long 


Nombre de blocs vraiment disponibles 




f_files 


long 


Nombre d'i-nceuds 




f_ff ree 


long 


Nombre d'i-nceuds libres 




f_fsid 


fsid_t 


Identifiant du systeme de fichiers (peu utilise actuellement) 




f_namel en 


int 


Longueur maximale des noms de fichiers 
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Le type de systeme de fichiers est indique sous forme numerique. II existe une constante 
symbolique pour chaque systeme connu par le noyau. Ces constantes sont definies dans les 
fichiers d'en-tete <linux/<XXX>_fs.h>, ou <XXX> correspond au nom du systeme de fichiers. 
La constante symbolique est alors <XXX>_SUPER_MAGIC. Par exemple, le systeme de fichiers 
ext2 est represente par la constante symbolique EXT2_SUPER_MAGIC, definie dans <1 i nux/ext2_ 
fs.h>, et prend la valeur 0xEF53. Une application n'a normalement pas besoin de connaitre 
ces valeurs. 

Nous pouvons utiliser cet appel-systeme pour obtenir des informations statistiques sur F utili- 
sation du systeme auquel appartient le fichier dont le nom est passe en argument. 

exemple_statfs.c : 

#1nclude <stdio.h> 
#include <sys/vfs.h> 

int 

main (int argc, char * argv[]) 
{ 

struct statfs etat; 

int i ; 

for (i =1; i < argc; i ++) { 

if (statfs(argv[i], & etat) < 0) { 

perror(argv[i ] ) ; 

continue; 

} 

fprintf (stdout, "%s : 1 bloc = %~\d octets \n" 



total %ld blocs \n" 

libre %ld blocs \n" 

disponible %ld blocs \n", 
argv[i], etat.f_bsize, 
argv[i], etat.f_bsize, 

etat.f_blocks, etat.f_bf ree, etat.f_bavail ) ; 



} 

return EXIT_SUCCESS; 

} 

L' execution donne un resultat comparable a la commande /bin/df, qui affiche les memes 
statistiques pour tous les systemes de fichiers en employant getmntentO sur /etc/mtab, 
comme nous Favons deja fait. 

$ ./exemple_statfs /etc/ 

/etc/ : 1 bloc = 4096 octets 
total 2579465 blocs 
libre 1733633 blocs 
disponible 1602603 blocs 



Les appels-systeme statfs ( ) et f staff s( ) ne sont pas definis par SUSv3 et ils ne sont que 
moyennement portables. Si cela pose un probleme, on peut s'inspirer des sources de l'appli- 
cation /bin/df qui emploie des appels-systeme differents suivant les machines, pour obtenir 




$ df 

Filesystem 

/dev/hda5 

$ 



lk-bl ocks 
10317860 



Used Available [lse% Mounted on 
3383328 6410412 2S% I 
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finalement le meme resultat. Notons egalement au passage la persistance d'un appel-systeme 
ustatO provenant de Systeme V, offrant un sous-ensemble des informations fournies par 
statfs( ), et done quasi obsolete de nos jours. 

Montage et demontage des partitions 

Nous ne detaillerons pas les mecanismes utilises pour monter ou demonter les partitions, car 
ils sont susceptibles de changer en fonction des versions du noyau. Precisons simplement 
rapidement la structure des appels-systeme mountO et umountO qui remplissent ce role. Ils 
sont declares dans <sy s /mount. h> : 

int mount (const char * fichier_special , 

const char * point_montage, const char * type_systeme, 

unsigned long attribut, const void * options); 
int umount (cont char * nom); 

Les arguments principaux de mountO ressemblent aux champs du fichier /etc/fstab. Un 
argument supplementaire est present pour preciser des attributs de montage. II doit etre rempli 
partiellement avec une valeur magique (OxCOED) et complete par des valeurs speciales definies 
dans le fichier d'en-tete <1 i nux/f s . h> , dependant done du noyau. 

Ces appels-systeme sont privilegies, necessitant la capacite CAP_SYS_ADMIN. L'utilitaire /bin/ 
mount est done installe Set-UID root, et il gere lui-meme les options user ou nouser qui auto- 
risent ou interdisent le montage d'un systeme par n'importe quel utilisateur. Ces options sont 
internes a 1' application et ne concernent pas 1' appel-systeme. 

Si on desire creer un logiciel qui permette a Putilisateur de monter ou de demonter des parti- 
tions decrites dans /etc/fstab (comme un gestionnaire graphique de fichiers), on emploiera 
done de preference les invocations suivantes : 

exeel ("/bin/mount", "/bin/mount", point_de_montage, NULL); 

et 

exeel ("/bin/umount", "/bin/umount" , point_de_montage, NULL); 

Cela simplifiera les verifications des autorisations et rejettera sur 1' application mount le 
probleme de compatibilite des systemes de fichiers avec la version du noyau. La configuration 
du logiciel - par le biais d'un fichier d' initialisation - ou d'une variable d'environnement peut 
permettre de preciser le chemin d'acces de mount et de umount pour le cas ou ils ne se trouvent 
pas dans /bin (ce qui est peu probable car ils doivent etre disponibles avec le minimum vital 
du systeme). 

Journalisation 

Linux incorpore plusieurs mecanismes de journalisation des informations. Tout d'abord, nous 
etudierons le mecanisme servant a connaitre le nom des utilisateurs connectes au systeme. 
Ensuite, nous examinerons le fichier permettant de garder une trace de toutes les connexions 
et redemarrages. Enfin, nous pourrons voir l'utilisation du systeme syslog, qui permet 
d'afficher et de memoriser tous les evenements importants en provenance d'une application 
systeme. 
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Journal utmp 

Le fichier utmp se trouve generalement dans le repertoire /var/run. On peut parfois le rencon- 
trer dans /var/adm, voire dans /etc suivant les distributions. II sert a memoriser Fetat present 
du systeme en stockant des lignes horodatees contenant une description d'un certain nombre 
d'evenements. 

Le fichier utmp est mis a jour par tous les utilitaires systeme (init, getty, login, xterm, 
telnetd...). Chacun de ces processus renseignant au fur et a mesure la ligne de utmp qui le 
concerne. 

Pour decrire ces donnees, la structure utmp est definie dans <utmp.h> : 



Norn 


Type 


Signification 


ut_type 


short i nt 


Description de I'enregistrement. II existe dix types differents, que nous 
examinerons ci-dessous. 


ut_pid 


pid_t 


PID du processus concerne. 


ut_l ine 


char [32] 


Fichier special de terminal (sans le prefixe /dev). 


ut_i d 


char [4] 


ChaJne d'identification au sein du fichier /etc/inittab. 


ut_user 


char [32] 


Norn de connexion de I'utilisateur. 


ut_host 


char [256] 


Norn de I'hote d'ou provient la connexion. 




ut_exit 


struct exit_status 


Etat de fin du processus. 


ut_session 


long int 


Identifiant de session. 


ut_tv 


struct timeval 


Horodatage de I'evenement. 


ut_addr_v6 


int32_t [4] 


Adresse IP de I'hote distant. 


Bien entendu, ces champs n'ont pas tous une signification simultanement. Leur utilisation 
depend du type d'enregistrement. 

Les differents types d'evenements possibles sont les suivants : 


Norn 




Signification 


EMPTY 


Enregistrement vide. 




RUN_LVL 


Changement de niveau d'execution du systeme. 


B00T_TIME 


Demarrage de la machine. Permet d'enregistrer I'heure de boot. 


0LD_TIME 


Ancienne heure, juste avant une modification de I'horloge interne. Cet enregistrement est suivi 
d'un enregistrement NEW_TIME. 


NEW_TIME 


Nouvelle heure, juste apres la modification de I'horloge interne. 


INIT_PROCESS 


Processus lance par init. 


L0GIN_PR0CESS 


Processus login. 




USER_PROCESS 


Connexion d'un utilisateur. 


DEAD_PROCESS 


Fin d'un processus. 




ACCOUNTING 


Debut de comptabilisation. 
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Pour comprendre le principe, reprenons a la mise en route de la machine : 

1. Un enregistrement B00T_TIME est ajoute des que le noyau a lance le processus init. Celui- 
ci determine alors son niveau d' execution et ajoute un enregistrement RUN_LVL. 

2. Le processus init consulte alors le fichier /etc/inittab et, pour chaque entree valide, il 
invoque f ork( ) et exec( ) pour lancer F application attendue (par exemple getty ou xdm), en 
ajoutant a chaque fois un enregistrement INIT_PROCESS avec les champs ut_id et ut_pid 
remplis. 

3. L'utilitaire getty recherche F enregistrement correspondant a son PID, remplit son champ 
ut_l ine avec le nom du terminal qu'il surveille, et modifie le champ ut_type pour qu'il 
contienne L0GIN_PR0CESS. 

4. Lorsqu'un utilisateur se connecte, getty execute login, qui recherche F enregistrement 
correspondant a son PID, remplit le champ ut_user et modifie le champ ut_type avec le 
type USER_PROCESS. 

5. L'utilitaire login peut aussi remplir les champs ut_host et ut_addr_v6 lorsqu'il a ete 
invoque par tel netd plutot que par getty. 

6. Lorsqu'un processus se termine, init en est informe grace a l'appel-systeme waitO, il 
remplit Fenregistrement correspondant a son PID avec les codes de retour et lui met un type 
DEAD_PROCESS. Les applications comme getty ou xterm recherchent d'abord s'il existe un 
enregistrement de ce type correspondant a leur fichier special avant d'en creer un nouveau. 

II n'y a en effet pas de moyen d'effacer un enregistrement. Leur nombre est limite de fait par 
la quantite de pseudo-terminaux permettant des connexions simultanees. 

Pour lire les informations de utmp, on utilise les fonctions setutentO et endutentO, qui 
initialisent et terminent la lecture, puis les routines getutent( ) ou sa contrepartie reentrante, 
getutent_r( ) , pour balayer le fichier sequentiellement. 

void setutent (void) ; 
void endutent (void) ; 
struct utmp * getutent (void); 

int getutent_r (struct utmp * utmp, struct utmp ** retour); 

Lorsqu'on recherche un enregistrement correspondant a un PID donne, comme le fait 1 ogi n, 
on utilise getutidO ou getutid_r(), qui prennent en argument une structure utmp. Celle-ci 
doit avoir des champs ut_pid et ut_type remplis. Si le champ utjype contient une constante 
xxx_PROCESS, on cherche un enregistrement ayant le meme ut_pid et un ut_type correspon- 
dant egalement a un xxx_PROCESS. Sinon, on recherche un enregistrement ayant le meme ut_ 
type et le meme ut_pid. Si aucune entree ne correspond, getutid ( ) renvoie NULL, et getutid_ 
r()-l. 

struct utmp * getutid (const struct utmp * utmp); 

int getutid_r (struct utmp * utmp, struct utmp ** retour); 

On peut aussi rechercher un enregistrement correspondant a un terminal particulier. Les fonc- 
tions getutlineO et getutline_r() prennent une structure utmp en argument et renvoient 
Fenregistrement correspondant a la meme valeur de utjline, avec un ut_type contenant 
L0GIN_PR0CESS ou USER_PROCESS. 

I struct utmp * getutline (const struct utmp * utmp); 

int getutline_r (struct utmp * utmp, struct utmp ** retour); 
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Finalement, nous pouvons ajouter un enregistrement dans la base de donnees utmp. La fonc- 
tion pututl i ne ( ) prend une structure utmp en argument et met a jour le fichier en recherchant 
un eventuel enregistrement avec le meme PID. Le pointeur renvoye est dirige vers une copie 
de la structure ajoutee, ou est NULL si le processus n'a pas les autorisations necessaires pour 
modifier la base de donnees utmp. 

| struct utmp * pututline (const struct utmp * utmp); 

Le programme suivant affiche une partie des informations contenues dans la base de donnees 
utmp. 

exemple_getutent.c : 

#i include <stdio.h> 
#include <utmp.h> 

void 

affi che_utmp (struct utmp * utmp) 
{ 

struct tm * tm; 

char heure[80]; 

tm = localtime(& (utmp->ut_tv.tv_sec)) ; 
strftimetheure, 80, "£x IT , tm); 
switch (utmp->ut_type) { 
case EMPTY : 

break; 
case RUN_LVL : 

printf ("%s : ", heure); 

printf ("Run-level \n"); 

break; 
case B00T_TIME : 

printf ("%s : ", heure); 

printfC'Boot \n"); 

break; 
case 0LD_TIME : 

printf ("%s : ", heure); 

pri ntf ( "Old Time \n") ; 

break; 
case NEW_TIME : 

printf ("%s : ", heure); 

printf ("New Time \n") ; 

break; 
case INIT_PR0CESS : 

printf ("%s : ", heure); 

printf("Init process, "); 

printf ("PID = %u, ", utmp->ut_pid) ; 

printf ("inittab = $s\n", utmp->ut_id) ; 

break; 
case L0GIN_PR0CESS : 

printf ("%s : ", heure); 

printf ("Login process, "); 

printfCPID = %u, ", utmp->ut_pid) ; 
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printfCTTY = £s\n", utmp->ut_l ine) ; 

break; 
case USER_PROCESS : 

printfCIs : ", heure); 

printfC'User process, "); 

printfC'PID = %u, ", utmp->ut_pid) ; 

printfCTTY = %s , ", utmp->ut_l ine) ; 

printf("$s \n", utmp->ut_user) ; 

break; 
case DEAD_PROCESS : 

break; 
default : 

printf ("?"); 

break; 




int 
main (void) 

{ 

struct utmp * utmp; 

while ((utmp = getutentO) != NULL) 

affiche_utmp(utmp) ; 
return EXIT_SUCCESS; 

} 



Voici un exemple sur une station Linux simple : 



$ ./exemple. 


_getutent 










01/04/05 


10 


04 


32 


Boot 










01/04/05 


10 


04 


32 


Run-1 evel 










01/04/05 


10 


04 


52 


Login process, 


PID 


= 540. 


TTY = 


ttyl 


01/04/05 


10 


04 


52 


Login process, 


PID 


= 541, 


TTY = 


tty2 


01/04/05 


10 


04 


52 


Login process, 


PID 


= 542, 


TTY = 


tty3 


01/04/05 


10 


04 


52 


Login process, 


PID 


= 543, 


TTY = 


tty4 


01/04/05 


10 


04 


52 


Login process, 


PID 


= 544, 


TTY = 


tty5 


01/04/05 


10 


04 


52 


Login process, 


PID 


= 545, 


TTY = 


tty6 


01/04/05 


10 


04 


52 


Init process, 


PID = 


546. 


inittab = x 


01/04/05 


10 


05 


52 


User process, 


PID = 


563. 


TTY = 


0, ccb 


01/06/05 


15 


09 


49 


User process. 


PID = 


1530. 


TTY = 


pts/1, ccb 



$ 



Nous remarquons les processus getty qui tournent sur les six consoles virtuelles, ainsi que le 
demon xdm qu'on reconnait grace a l'identificateur x present dans /etc/inittab. Enfin, deux 
connexions se font, l'une directement depuis un xterm (TTY=:0), et la seconde par un telnet 
depuis le reseau. 

Fonctions X/Open 

Une partie des routines que nous avons etudiees dispose d' equivalents portables car ils sont 
declares dans SUSv3. Ces fonctions manipulent les enregistrements utmp par 1' intermediate 
d'une structure utmpx ayant les membres suivants (identiques a ceux de la structure utmp). 
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Nom 




Type 


ut_type 


short int 




ut_pid 


pid_t 




ut_l ine 


char [32] 




ut_l d 


char [4] 




ut_user 


char [32] 




ut_tv 


struct timeval 





Les fonctions suivantes sont equivalentes a leurs homologues traitant les structures utmp. 
Elles sont d'ailleurs definies dans la bibliotheque GlibC par des alias. Notons qu'il n'existe 
pas de fonction reentrante : 

void setutxent (void); 

void endutxent (void); 

struct utmpx * getutxent (void); 

struct utmpx * getutxid (const struct utmpx * utmpx); 

struct utmpx * getutxline (const struct utmpx * utmpx); 

struct utmpx * pututxline (const struct utmpx * utmpx); 

Toutes ces fonctions sont declarees dans <utmpx.h>. 

Journal wtmp 

Le fichier utmp est efface a chaque demarrage de la machine, et lorsqu'un processus de 
connexion se termine, son enregistrement est marque comme DEAD_PROCESS avant d'etre reuti- 
lise ensuite. II existe egalement sur le systeme Linux un fichier nomme wtmp qui n'est pas 
efface. Les enregistrements y sont ajoutes successivement. Ce fichier sert d'historique des 
connexions. On le trouve en general dans /var/1 og, mais on peut aussi le rencontrer dans 
/var/adm ou /etc. Sur certaines machines, il est egalement copie automatiquement sur une 
imprimante systeme afin de conserver une trace de toutes les connexions des utilisateurs, a 
des fins de securite. Le fichier wtmp est souvent archive ou efface de facon automatique une 
fois par mois par un script d' administration declenche par le demon crond. 

Pour examiner le contenu de wtmp, on peut utiliser les memes routines que celles que nous 
avons deja etudiees. Pour cela, il existe une routine nommee utmpnameO qui permet de 
preciser le nom du fichier qu'on veut lire. Par defaut, c'est le fichier utmp du systeme qui est 
utilise, mais cette fonction permet d'en indiquer un autre. 

int utmpname (const char * fichier); 

Pour savoir ou se trouve le fichier a lire, on peut employer l'une des macros _PATH_UTMP et 
_PATH_WTMP, qui se transforment en chaines de caracteres representant le chemin du fichier 
utmp ou wtmp. 

Dans l'exemple suivant, nous fournissons les noms de fichiers sur la ligne de commande. Le 
programme emploie la routine aff iche_utmp( ) de l'exemple precedent, que nous ne reecri- 
vons pas ici. 
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exempleutmpname.c : 

#include <stdio.h> 
#include <utmp.h> 

int 

main (int argc, char * argv[]) 
{ 

struct utmp * utmp; 
int i; 
for (i = 1; i < argc; i ++) { 
if (utmpname(argv[l] ) != 0) 
continue; 

while ((utmp = getutentO) != NULL) 
affiche_utmp(utmp) ; 

} 

return EXIT_SUCCESS; 

} 

Ce programme offre le me me genre de resultat que l'utilitaire last. 
$ ./exemple_utmpname /var/log/wtmp 



01/04/05 


20 


47 


43 


Boot 












01/04/05 


20 


47 


43 


Run-1 


evel 










01/04/05 


20 


47 


43 


Im't 


process , 


PID 




127, 


inittab = 15 


01/04/05 


20 


48 


03 


Init 


process , 


PID 




526, 


inittab = ud 


01/04/05 


20 


48 


03 


Init 


process , 


PID 




527, 


inittab = 1 


01/04/05 


20 


48 


03 


Init 


process , 


PID 




528, 


inittab = 2 


01/04/05 


20 


48 


03 


Init 


process. 


PID 




529, 


inittab = 3 


01/06/05 


10 


05 


52 


User 


process , 


PID 




563, 


TTY = :0. ccb 


01/06/05 


10 


58 


42 


User 


process , 


PID 




795, 


TTY = ftpd795. ccb 


01/06/05 


11 


00 


09 


User 


process. 


PID 




806, 


TTY = pts/1, ccb 


01/06/05 


15 


09 


49 


User 


process , 


PID 




1530. 


TTY = pts/1, ccb 


01/06/05 


15 


36 


52 


User 


process , 


PID 




1580, 


TTY = ftpdl580, ccb 


01/06/05 


16 


12 


20 


User 


process , 


PID 




1631. 


TTY = ftpdl631, ccb 



$ 

Notre routine d'affichage des enregistrements n'est peut-etre pas tres adaptee a la presentation 
de traces de connexions, car nous devrions plutot eliminer les lignes contenant les enregistre- 
ments INIT_PR0CESS ou LOGI N_PR0CESS qui correspondent aux getty et 1 ogi n, et conserver les 
DEAD_PR0CESS qui representent la deconnexion d'un utilisateur. 

Pour ajouter un enregistrement au fichier wtmp, on n'utilisera pas pututl ine( ), car elle ecrase 
les entrees inutilisees, mais plutot updwtmp( ) , qui ecrit simplement la nouvelle ligne de 
donnees a la fin du fichier. 

void updwtmp (const char * fichier, const struct utmp * utmp); 



Journal syslog 

Une application, meme si elle fonctionne en arriere-plan, doit pouvoir communiquer des 
informations de temps a autre. L'ecriture sur stdout ou stderr n'est pas toujours possible, 
notamment pour les logiciels fonctionnant sous forme de demons. Pour pouvoir transmettre 
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des indications sur son etat, un programme peut alors employer plusieurs techniques, comme 
remission d'un courrier electronique a destination de l'utilisateur qui l'a lance, ou proposer 
une connexion reseau (par tel net) et afficher ainsi sa configuration. 

Une autre methode, plus souple, consiste a utiliser le demon syslogd. Celui-ci est lance au 
demarrage par les scripts d' initialisation du systeme et il reste en attente de messages. Les 
fonctions de bibliotheque openlogO, syslogO et closelogO permettent de lui transmettre 
des donnees. En fonction de la configuration du demon (via /etc/syslog.conf) et de la 
gravite du message, celui-ci peut etre stocke dans un fichier, envoye dans un tube nomme vers 
un autre programme (en general mail), affiche sur la console et sur les ecrans des utilisateurs, 
ou meme transmis par le reseau a destination d'un autre demon sysl ogd fonctionnant sur une 
machine de supervision. 

Ces trois routines sont disponibles dans <syslog.h> : 

void openlog (char * identificateur, int option, int type); 
void syslog (int urgence, char * format, ...); 
void closelog (void) ; 

La fonction openl og( ) permet d'ouvrir une session de journalisation. Le premier argument est 
un identificateur qui sera ajoute a chaque message pour le distinguer. En general, on choisit le 
nom du programme. 

Le second argument peut contenir une ou plusieurs des constantes symboliques suivantes, 
liees par un OU binaire : 



Nom 


Signification 


LOG 


_C0NS 


Ecrire les messages sur la console systeme si une erreur se produit lors de leur traitement. 


LOG 


_N DELAY 


Ouvrir tout de suite la communication avec le demon syslogd, sans attendre I'arrivee du premier 
message. 


LOG 


_PERR0R 


Envoyer sur la sortie d'erreur une copie des messages. 


LOG 


_PID 


Ajouter le PID du processus appelant dans chaque message. 



Lutilisation de L0G_PERR0R permet de simplifier la mise au point d'un programme qu'on fera 
fonctionner ensuite sous forme de demon. De meme, L0G_PID est tres utile car cette informa- 
tion est souvent indispensable, et on evite ainsi de devoir l'inscrire explicitement dans chaque 
message. 

Enfin, le troisieme argument de openl og( ) est une valeur numerique servant a classer le pro- 
gramme dans une categorie de logiciels. Cela permet de filtrer les messages, par exemple en 
redirigeant tous ceux qui concernent le courrier vers l'utilisateur postmaster. Les constantes 
suivantes sont declarees dans <sysl og . h> : 





Nom 


Utilisation 


L0G_ 


.KERN 


Message provenant du noyau 


L0G_ 


.USER 


Message provenant d'une application utilisateur 


L0G_ 


.MAIL 


Systeme de gestion du courrier electronique 


L0G_ 


.DAEMON 


Ensemble des demons du systeme 
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Norn 


Utilisation 




LOG. 


AUTH 


Systeme d'authentification des utilisateurs 




L0G_ 


.SYSLOG 


Demon syslogd lui-meme 




L0G_ 


_LPR 


Systeme de qestion des impressions 




L0G_ 


.NEWS 


Systeme des news Usenet 




L0G_ 


.UUCP 


Message provenant d'un demon uucp 




L0G_ 


.CRON 


Execution differee par crond 




L0G_ 


AUTHPRIV 


Systeme d'authentification personnel 




L0G_ 


.FTP 


Demon f tpd 




LOG 


.LOCALO ._L0G_L0CAL7 


Message provenant d'une application specifique du systeme 






On emploiera generalement LOGJSER ou L0G_L0CAL0 a L0G_L0CAL7 pour les logiciels personnels. 

En fait, openl og( ) ne fait qu' initialiser des champs qui seront utilises ensuite lors de la trans- 
mission effective des messages. Pour en envoyer un, on emploie syslogO. Cette fonction 
prend un premier argument qui correspond a Furgence du message. On definit les niveaux de 
priorite suivants : 





Norn 


Signification 


LOG. 


.EMERG 


Le systeme concerne n'est plus utilisable. 


LOG. 


ALERT 


L'intervention immediate d'un administrateur est indispensable ou le systeme va devenir 
inutilisable. 


LOG. 


_CRIT 


Des conditions critiques se presentent, pouvant necessiter une intervention. 


LOG. 


.ERR 


Des erreurs ont ete detectees. 


LOG. 


WARNING 


Des conditions rares ou inattendues ont ete observees. 


LOG. 


.NOTICE 


Information importante, mais fonctionnement normal. 


LOG. 


.INFO 


Information sans importance renseignant sur I'etat du systeme. 


LOG 

1 


.DEBUG 


Donnees utiles pour le debogage, a ignorer sinon. 



On notera que le terme « systeme » dans ce tableau fait reference a 1' application invoquant 
syslogO et eventuellement a ses interlocuteurs, mais qu'il ne regroupe pas l'ensemble des 
fonctionnalites de la machine comme on l'entend habituellement. 

Le format se trouvant en second argument de syslog( ) ainsi que les autres arguments even- 
tuels correspondent exactement a ceux de printf ( ). La seule difference est l'existence d'un 
code %m qui est remplace par la chaine strerror(errno). 

Si openl og( ) n'a pas encore ete appelee, sysl og( ) l'invoque automatiquement avec les argu- 
ments : 

• identificateur = NULL ; 

• option = 0 ; 

• type = LOGJSER. 
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La routine cl osel og( )ferme la session de communication avec sysl ogd. Cette fonction n'est 
pas indispensable, la session etant terminee automatiquement a la fin du programme. 

Pour des raisons de securite - comme nous l'avons deja mentionne avec printf ( ) - il faut 
toujours utiliser syslog(urgence, "%s" , message) et jamais syslog(urgence, message) si le 
message est susceptible d'etre fourni par l'utilisateur. Ceci concerne surtout les demons et les 
applications reseau. 

Voici un exemple simple utilisant sysl og( ). 
exemple_syslog.c : 

#include <stdio.h> 
#include <syslog.h> 

int 

main (int argc, char * argv[]) 
{ 

int i ; 

openlog(argv[0], L0G_PID, LOGJJSER); 
for (i =1; i < argc; i ++) 

syslog(L0G_INF0, argv[i]); 
cl osel og( ) ; 

return EXIT_SUCCESS; 

} 

A l'execution de ce programme les messages sont rediriges, sur notre systeme, vers le fichier 
/var/1 og/messages, lisible uniquement par root. 

$ ./exemple_syslog "premier message" 
$ ./exemple_syslog "deuxieme message" 
$ su 

Password: 

# tail /var/1 og/messages 
[...] 

Jan 06 17:37:12 venux ./exemple_syslog[1807]: premier message 
Jan 06 17:37:19 venux ./exemple_syslog[1808]: deuxieme message 
[...] 

# 

L'utilisation de sysl og( ) est fortement recommandee pour le developpement d' applications 
fonctionnant essentiellement en arriere-plan, car cette routine laisse a 1'administrateur du 
systeme le choix du comportement vis-a-vis des messages de diagnostic et d'erreur. Cette 
souplesse est tres appreciable car on peut ainsi plus facilement decider d'eliminer tous les 
messages peu importants, de les stocker dans un fichier ou de les rediriger vers une console 
reservee a cet usage. 

Conclusion 

Nous avons vu dans ce chapitre les methodes pour acceder a de nombreuses informations 
concernant le systeme. Une large partie d'entre elles sont suffisamment portables pour etre 
disponibles sur l'essentiel des systemes Unix. 
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Les fonctions presentees ici sont certainement suffisantes pour realiser la plus grande partie 
des taches d' administration du systeme. On trouvera plus de details sur ces travaux ainsi que 
sur les differents outils d'aide a l'administrateur dans [Frisch 2003] Les bases de Vadminis- 
tration systeme. 

L' utilisation des fonctionnalites du demon syslogd dans un programme lui apporte une 
souplesse notable. Pour la configuration du demon proprement dit, on pourra se reporter aux 
pages de manuel syslogd(8) et syslog.conf (5). 
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Nous avons deja signale dans le chapitre 23, a propos des caracteres larges, que les deve- 
loppeurs se soucient de plus en plus des possibilites d'internationalisation de leurs logiciels. 
En dehors des applications « maison », destinees a un usage unique et tres specifique, la 
plupart des programmes peuvent voir subitement leur portee etendue a une echelle internatio- 
nale grace a Internet par exemple. 

En raison du volume de discussion qu'engendrent les problemes d'internationalisation, un 
sigle a meme ete cree, H8n, signifiant « i suivi de 18 lettres puis d'un n », afin d'eviter les 
guerres de clans entre les partisans du mot internationalisation et ceux - americains - du 
terme internationalization. 

Apres avoir presente les principes de 1' internationalisation, nous examinerons des methodes 
permettant d'offrir des messages d'interface dans la langue de l'utilisateur. Malgre tout, 
F internationalisation d'un logiciel ne consiste pas uniquement en la traduction des messages 
de l'interface utilisateur, meme s'il s'agit probablement du point le plus important dans la 
plupart des cas. En fait, la langue n'est qu'une partie des conventions culturelles propres a un 
peuple, et l'ordre de presentation des elements d'une date est par exemple un autre aspect de 
F internationalisation d'une application. 

Pour permettre la transposition d'un systeme vers d'autres pays, la bibliotheque C autorise 
l'utilisateur a configurer ces elements culturels et linguistiques a son gre. L' adaptation aux 
desirs de l'utilisateur se fait par le biais de la localisation 1 . 

Nous verrons dans ce chapitre comment employer l'ensemble des elements configures dans la 
localisation. 



1. Le mot anglais locale est traduit differemment suivant les auteurs. Je conserverai le terme localisation, qui est le plus 
repandu meme s'il n'est pas tres esthetique. 
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Principe 

La localisation est un ensemble de regies, reparties par categories, que la bibliotheque C 
applique dans les routines qui doivent reagir differemment suivant les choix de Futilisateur. 
Par exemple, il existe une categorie dans laquelle on indique le caractere qu'on prefere 
utiliser pour separer la partie entiere d'un nombre reel de ses decimales. Dans la localisation 
anglo-saxonne, il s'agit du point, alors que dans la localisation francaise on prefere la virgule. 
Certaines routines d'affichage comme printf ( ) prennent cette information en consideration 
pour presenter leurs resultats. 

La plupart des utilitaires du systeme sont sensibles a la localisation, du moins en ce qui 
concerne la traduction des messages. Nous pourrons done observer directement quelques 
effets des modifications apportees. Pour configurer sa localisation, un utilisateur remplit des 
variables d'environnement qui seront consultees par les applications lancees par la suite. 

Comme nous l'avons precise dans le chapitre 3, les variables d'environnement ne concernent 
que le processus qui les configure et ses descendants. Si Futilisateur definit sa localisation 
dans une session shell, toutes les applications lancees ensuite grace a ce shell en beneficie- 
ront, mais pas les logiciels demarres depuis un autre shell ou depuis un environnement 
graphique X- Window. Ladministrateur du systeme configure souvent une localisation par 
defaut dans les fichiers d' initialisation communs a tous les utilisateurs. II s'agit generalement 
de la localisation correspondant a l'implantation physique de la station. Chaque utilisateur 
peut toutefois modifier cette configuration dans ses propres scripts de connexion afin de 
1' adapter a ses preferences. 

Pour beneficier automatiquement de l'internationalisation des routines de la bibliotheque C, il 
suffit d'inserer deux lignes dans une application : 

• Le fichier d'en-tete <1 ocal e . h> doit etre inclus en debut de module. 

• Linstruction setl ocal e( LC_ALL , " " ) doit etre appelee en debut de programme. 

Rien qu'avec ces deux lignes un programme est capable de s' adapter correctement a la 
plupart des conventions culturelles de Futilisateur, hormis la langue bien entendu. Pour 
obtenir une internationalisation au niveau du langage, il faut stocker les messages et leurs 
traductions dans des catalogues, comme nous le verrons plus loin. 

Categories de localisations disponibles 

Nous avons indique que la localisation se faisait par Fintermediaire de plusieurs categories 
differentes. Ceci permet a Futilisateur de configurer independamment plusieurs aspects de 
Finterface de F application. Par exemple, il est possible de demander que les messages soient 
affiches en francais pour faciliter la lecture, mais que les dates et les valeurs numeriques 
soient affichees en respectant les normes americaines, afin de recuperer directement ces 
donnees pour les transmettre a des collegues etrangers. 

Chaque categorie est representee par une variable d'environnement et par une constante 
symbolique du meme nom, disponible au sein de F application. Les categories sont les 
suivantes : 
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Norn Signification 



LC. 


.ALL 


Cette categorie ecrase toutes les autres. On I'utilise pour donner une valeur immediate de 
localisation a toutes les categories. En realite, I'emploi de cette variable d'environnement comme 
configuration est un peu abusif, elle ne devrait etre utilisee qu'en tant que constante symbolique 
pour consulter la localisation. 


LC. 


.COLLATE 


Dans cette categorie se trouvent les regies employees par les routines devant ordonner des 
chaines de caracteres, comme strcol 1 ( ) , que nous avons etudiee dans le chapitre 15. 


LC. 


.CTYPE 


Cette categorie concerne les routines de classification des caracteres comme i sal pha C ), ainsi 
que celles de conversion comme tolowerO. Elle serf egalement a determiner les regies 
employees pour les conversions entre caracteres larges et sequences multioctets, comme nous 
I'avons indique dans le chapitre 23. 


LC. 


.MESSAGES 


La traduction des messages reclamee par la categorie LC_MESSAGES concerne I'interface avec 
I'utilisateur. II ne s'agit pas necessairement de la meme langue que celle qui est employee dans les 
donnees elles-memes ni surtout du meme jeu de caracteres. 


LC. 


.MONETARY 


Cette categorie configure la maniere de representer des valeurs monetaires, tant du point de vue 
du symbole evoquant la monnaie que pour la position de ce symbole, et la separation entre partie 
entiere et decimale. 


LC. 


.NUMERIC 


Avec cette categorie, on indique les coutumes de representation des valeurs numeriques, comme 
la separation des chiffres par milliers ou le symbole utilise comme separateur decimal. 



LANG La variable LANG sert a definir la langue utilisee pour I'ensemble des messages et des textes, mais 

c'est surtout une valeur par defaut, qui permet de configurer toutes les categories qui ne sont pas 
remplies explicitement. 



La localisation est done I'ensemble de toutes ces categories, representant chacune des regies 
usuelles appliquees a 1' emplacement ou se trouve I'utilisateur. Pour remplir une categorie, on 
emploie une chaine de caracteres indiquant en premier lieu la langue choisie. II s'agit de deux 
caracteres minuscules, dont voici quelques exemples : 





Norn 


Langue 




da 


danois 




de 


allemand 




el 


grec 




en 


anglais 




es 


espagnol 




fi 


finnois 




fr 


francais 




it 


italien 




nl 


hollandais 




Pt 


portugais 




sv 


suedois 



Le nom de la localisation est ensuite precise par un emplacement geographique si plusieurs pays 
emploient la meme langue, mais avec des differences de coutumes dans d' autres categories. 
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Par exemple, si on demande Faffichage de la valeur monetaire 2000 avec une localisation 
francophone de France (f r_FR), on obtient 

| 2 000, 00€ 

alors que Faffichage avec la localisation francophone du Canada (f r_CA) donne 
2 000,00$ 

Fa meme valeur en anglais du Canada (en_CA) est affichee : 
$2,000.00 

En anglais de Grande-Bretagne (en_GB), le resultat est : 
£2,000.00 

Alors qu'en anglais commun au Royaume-Uni (en_UK), on voit : 
2000.00 

F' emplacement geographique est done precise avec un code de deux lettres majuscules. Voici 
quelques pays europeens : 



Pays 


Code 


Allemagne 


DE 


Angleterre 


GB 


Autriche 


AT 


Belgique 


BE 


Danemark 


DK 


Grece 


EL 


Espagne 


ES 


Finlande 


FI 


France 


FR 


Irlande 


IR 


Italie 


IT 


Luxembourg 


LU 


Hollande 


NL 


Portugal 


PT 


Suede 


SV 



Une source frequente d'erreur lors de la configuration de la localisation est 1' inversion entre 
le pays et la langue 1 . Ainsi la disposition des majuscules dans "FR_fr" parait plus naturelle 
que dans "fr_FR", mais e'est pourtant ce second cas seulement qui fonctionne, le premier 



1. Disons la deuxieme source d'erreur la plus frequente, la premiere etant l'oubli pur et simple de l'appel a setl ocal e 
( LC_ALL , " " ) en debut de programme. . . 
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etant inconnu (done ignore et equivalent a la localisation americaine par defaut). Dans certaines 
situations, on peut ajouter le nom d'un jeu de caracteres a la suite, mais e'est plutot rare. 



Attention 

Les noms des localisations proprement dites peuvent varier suivant les systemes d'exploitation. Nous decri- 
vons ici leur aspect avec la GlibC, mais il ne faut pas faire de suppositions natives quant au contenu des varia- 
bles sur d'autres systemes. 



Voyons done les effets de la localisation sur quelques utilitaires, en commencant par les 
messages d'erreur de /bi n/1 s : 

$ unset LANG 
$ unset LC_ALL 
$ export LANG=fr_FR 
$ Is inexistant 

Is: inexistant: Aucun fichier ou repertoire de ce type 
$ export LANG=en 
$ Is inexistant 

Is: inexistant: No such file or directory 
$ export LC_MESSAGES=fr 
$ Is inexistant 

Is: inexistant: Aucun fichier ou repertoire de ce type 
$ 

Nous allons observer a present les repercussions de la localisation sur l'affichage de la date. 
On verifiera que la categorie LC_ALL a bien preseance sur LANG. Le format "%x" ordonne a 
Futilitaire /bin/date d'afficher la representation locale de la date. Le test a lieu le 8 mars. 

$ unset LANG LC_ALL 
$ export LANG=en 
$ date +"%x" 

03/08/00 

$ export LC_ALL=fr_FR 
$ date +"%x" 

08.03.2000 
$ 

Pour connaitre les regies applicables dans une localisation donnee, la bibliotheque C dispose 
de fichiers de configuration places en general dans les repertoires /usr/locale/ ou /usr/ 
share/locale/. On y trouve normalement un nombre important de sous-repertoires, chacun 
representant une localisation connue par le systeme. Tout cela peut varier legerement en fonc- 
tion de la distribution Linux choisie. Les fichiers employes par la bibliotheque C sont dans un 
format binaire. Pour modifier une localisation existante - ou en creer une nouvelle -, il faut 
installer les sources des localisations. Elles sont generalement etablies avec l'ensemble des 
sources de la GlibC. On peut invoquer /usr/bin/1 ocal edef --help pour savoir ou les sources 
des localisations sont placees (par exemple /usr/share/i 18n/l ocal e/). Ce repertoire regroupe 
un ensemble de fichiers decrivant toutes les localisations connues par la bibliotheque. Ces 
fichiers sont tout a fait lisibles, leur format est assez intuitif. Lutilitaire /usr/bin/1 ocal edef 
sert a compiler l'un de ces fichiers en creant les repertoires systeme et les fichiers binaires 
necessaires pour que la nouvelle localisation soit reconnue par la bibliotheque C. Cette tache 
est normalement reservee a radministrateur du systeme. 
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Traduction de messages 

Le fait de proposer une interface dans la langue de l'utilisateur est probablement le premier 
souhait en ce qui concerne Finternationalisation d'un programme. La traduction automatique 
des messages d'une langue a l'autre n'est pas encore possible, aussi un programme doit-il 
employer pour ses messages un stock de libelles, et afficher ceux qui correspondent a la 
langue de l'utilisateur. 

L' ensemble de tous les messages et leurs traductions peuvent etre directement inseres dans le 
code source de l'application. La selection du libelle correspondant a la traduction d'un message 
dans la langue desiree se fera en fonction d'un parametrage interne (choix dans un menu) ou 
externe (variable d'environnement). Cette methode est parfois employee lorsqu'un logiciel 
doit etre distribue sous forme binaire sur des systemes d' exploitation totalement differents, 
n'offrant pas toujours des possibilites d'internationalisation. Si cette approche se justifie done 
dans certains cas, elle est quand meme fortement deconseillee, car l'ajout du support d'une 
nouvelle langue ou la correction d'une faute de traduction d'un message necessitent la recom- 
pilation de l'application. 

On prefere done regrouper les libelles dans un fichier externe, qu'on peut echanger au gre de 
la localisation. 

II y a un avantage supplementaire au regroupement de tous les messages dans un unique 
fichier, meme sans tenir compte des possibilites de traduction. Cela permet en effet d' avoir 
sous les yeux tous les libelles d' interface du logiciel et de s' assurer immediatement de 
l'homogeneite de l'ensemble. Lorsqu'il y a plusieurs possibilites pour nommer un objet 
manipule par le programme, ou s'il faut choisir entre traduire un nom ou laisser le terme 
original qu'on pourra retrouver dans d'autres logiciels, on s'assure, en voyant tous les 
messages cote a cote, que les memes decisions ont ete prises pour toute P interface. 

La bibliotheque GlibC offre deux methodes differentes pour gerer un ensemble de messages 
externes, stockes dans des fichiers qui pourront etre mis a jour sans que l'application ait 
besoin d'etre recompilee. Ces deux dernieres necessitent d'abord que la bibliotheque puisse 
trouver le fichier de messages lui appartenant, adapte a la langue choisie. Les differences 
apparaissent ensuite dans la maniere d'acceder aux libelles contenus dans le fichier propre- 
ment dit. 

Catalogues de messages geres par catgetsQ 

Ce premier mecanisme est plus ancien et plus repandu que le second. II rend aussi le travail 
du developpeur sensiblement plus complique. Les fonctions catopenO, catgetsO et 
catcloseO que nous allons examiner sont definies dans les specifications SUSv3. Chaque 
message du logiciel doit etre associe a une cle numerique unique. Ceci represente le point le 
plus complexe, principalement lorsque le developpement d'une application se fait de maniere 
repartie avec plusieurs equipes independantes. 

Tout d'abord, le programme doit ouvrir le catalogue de messages. Ceci s'effectue avec la 
fonction catopenO, declaree ainsi dans <nl_types.h> : 

nl_catd catopen (const char * nom, int attribut); 

Cette routine essaye d'ouvrir le catalogue dont le nom est passe en premier argument. Si ce 
nom contient un caractere « / », on considere qu'il s'agit d'un chemin d'acces entier. Sinon, 



Internationalisation 

Chapitre 27 



on suppose qu'il s'agit du nom d'un catalogue qui est alors recherche dans divers repertoires 
suivant la configuration des variables d'environnement. Le fait d' employer un chemin fige ne 
se justifie que lors de la mise au point du programme, car le principe meme de 1' internationa- 
lisation consiste a laisser l'utilisateur configurer le repertoire correspondant a sa localisation. 

La recherche se fait en employant la variable d'environnement NLSPATH. Celle-ci contient un 
ou plusieurs chemins d'acces separes par des deux-points. Un chemin peut comprendre des 
codes speciaux, qui seront remplaces automatiquement lors de la tentative d'ouverture : 



Code 


Signification 


ZN 


Nom du catalogue tel qu'il a ete transmis en premier argument de catopen ( ) . 


%l 


Localisation configuree pour les messages d'interface. 


f\ 


Langage configure pour les messages d'interface, sans preciser I'emplacement ni le jeu de caracteres. 
Par exemple f r dans la localisation f r_BE. ISO-8859-1. 


%t 


Emplacement configure pour les messages d'interface, sans preciser la langue ni le jeu de caracteres. 
BE dans la localisation fr_BE. ISO-8859-1. 


%c 


Jeu de caracteres configure pour les messages d'interface, sans preciser la langue ni I'emplacement 
geographique. ISO-8859-1 dans la localisation fr_BE. ISO-8859-1. 



%% Le caractere % lui-meme. 



L'attribut indique en seconde position lors de l'appel de catopenO permet de preciser les 
variables prises en compte pour la localisation. Si cet attribut est nul, la fonction n'emploie 
que la variable LANG. Sinon, si l'attribut prend la valeur NL_CAT_LOCALE, la bibliotheque 
recherche la localisation successivement dans les variables LC_ALL, LC_MESSAGES et LANG. On 
emploiera done toujours NL_CAT_LOCALE en second argument de catopen( ). 

Si la variable NLSPATH n'est pas definie, la fonction emploie une valeur par defaut, configuree 
lors de la compilation de la bibliotheque C, qui correspond generalement a : 

/usr/share/1 ocal eALAN: /usr/share/1 ocal eAL/LCJOSAGESAN: /usr/share/1 ocal e/ll 
W AN: /usr/share/1 ocal e/%l/LC_MESSAGES/£N 

Cela signifie que lors d'une tentative d'ouverture du fichier de catalogue msg, dans la localisa- 
tion f r_FR, le systeme recherche le fichier successivement dans : 

/usr/share/1 ocal e/f r_FR/msg 
/ usr/share/1 ocal e/f r_FR/LC_MESSAGES/msg 
/usr/share/locale/fr /msg 
/usr/share/1 ocal e/f r/LC_MESSAGES/msg 

Le descripteur de catalogue est du type opaque nl_catd et sera employe dans les fonctions 
catgetst ) et catel ose( ). Si aucun fichier n'est disponible, catopen( ) renvoie (nl_catd) -1. 

Une fois que le catalogue de messages est ouvert, on peut acceder a son contenu a l'aide de la 
fonction catgets( ), declaree ainsi : 

char * catgets (nl_catd catalogue, 

int ensemble, int message, 
const char * original ) ; 
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Cette fonction recherche dans le catalogue decrit par son premier argument - obligatoirement 
obtenu grace a catopen( ) - le message appartenant a Fensemble indique en deuxieme posi- 
tion, et dont le numero est passe en troisieme argument. Si le message n'est pas disponible, la 
chaine transmise en dernier argument est renvoyee. 

Cette chaine est done redigee dans une langue par defaut, la plupart du temps en anglais. 
L' organisation du catalogue sous forme d' ensembles de messages permet de decouper 1' appli- 
cation en ensembles fonctionnels, en attribuant un numero general a chaque equipe de deve- 
loppement afin qu'elle maintienne elle-meme la numerotation dans son propre ensemble. Les 
numeros peuvent etre choisis arbitrairement, ils n'ont pas besoin de se suivre. Par contre, la 
paire (ensemble, numero) ne peut designer qu'un seul message dans le catalogue. 

Ceci complique sensiblement le travail des programmeurs, qui doivent gerer une nomencla- 
ture supplementaire dans leurs applications. 

Pour refermer un catalogue de messages qui n'est plus utilise, on emploie catcloseO, 
declaree ainsi : 

int catclose (nl_catd catalogue); 

Cette fonction renvoie 0 si tout s'est bien passe, et -1 si une erreur s'est produite (generale- 
ment e'est le descripteur de catalogue qui est errone). 

Les catalogues sont crees a Faide de Futilitaire /usr/bin/gencat. Celui-ci prend en entree un 
fichier de texte contenant les chaines de caracteres et fabrique un fichier binaire permettant 
Faeces rapide avec catgetsO. Le detail de ce fichier binaire ne concerne que la biblio- 
theque C. Le format des fichiers lus par gencat est decrit en detail dans la documentation 
Gnu. Voyons-en les principales caracteristiques : 

• Les lignes blanches ou commencant par un symbole $ suivi d'un caractere blanc sont igno- 
rees. On peut introduire ainsi des commentaires. 

• Une ligne ayant la forme $set <i denti f i ant> indique le debut d'un ensemble de messages. 

• Une ligne ayant la forme <identifiant> <chaine de caracteres> precise un message 
appartenant a 1' ensemble en cours. 

L'identifiant de 1' ensemble ou celui du message peuvent etre signales sous forme numerique, 
mais egalement sous forme de mot-cle alphanumerique. Dans ce cas, gencat les remplacera 
par des numeros adequats, et creera un fichier oil les identifiants seront definis sous forme de 
constantes symboliques. On pourra done inclure ce fichier en debut de programme. Pour creer 
les constantes symboliques, gencat ajoute le suffixe Set a la fin des noms d'ensembles et 
insere le nom de l'ensemble devant les chaines. Le programme suivant va permettre de mieux 
comprendre ce principe. 

exemple_catgets.c : 

#include <nl_types.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include "exemple_catgets.h" 

int 
main (void) 
{ 

nl_catd catalogue; 
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char * chaine; 

if ((catalogue = catopent "msg_catgets" , NL_CAT_LOCALE) ) 
== (nl_catd) -1) { 
fprintf (stderr, "unable to open catalog \n"); 
exi t( EXIT_FAI LURE) ; 

} 

chaine = catgets(catalogue, premier_Set, premier_chaine_l, 
"This is the first string in the first set"); 
fprintf (stdout, "%s \n", chaine); 

chaine = catgets(catalogue, premier_Set, premier_chaine_2, 

"and here is the second string in the first set."); 
fprintf (stdout, "%s \n", chaine); 

chaine = catgets(catalogue, second_Set, second_chaine_l, 

"Now let's have a look at the 1st string in 2nd set,"); 
fprintf (stdout, "%s \n", chaine); 

chaine = catgets(catalogue, second_Set, second_chaine_2, 

"and finaly the second string in the second set."); 
fprintf (stdout, "%s \n", chaine); 
catclose(catalogue) ; 
return EXIT_SUCCESS; 

} 

Nous construisons aussi le fichier de messages traduits en francais ainsi : 
exemple_catgets.msg : 

$ Voici le catalogue de messages pour 
$ 1 'exemple_catgets. 

$set premier_ 

chaine_l Ceci est la premiere chaine du premier ensemble, 
chaine_2 et voici la seconde chaine du premier ensemble. 

$ Nous pouvons inserer des commentaires 
$ qui seront ignores 

$set second_ 

chaine_l Maintenant voyons la lere chaine du 2eme ensemble, 
chaine_2 et finalement la seconde chaine du second ensemble. 

A present, nous compilons le catalogue de messages, en demandant a gencat de nous fournir 
aussi un fichier de definition des constantes : 

$ gencat -o msg_catgets -H exemple_catgets.h exemple_catgets.msg 
$ cat exemple_catgets.h 

#define second_Set 0x2 /* exemple_catgets.msg:ll */ 
#define second_chaine_l 0x1 /* exemple_catgets.msg:12 */ 
#define second_chaine_2 0x2 /* exemple_catgets.msg:13 */ 

#define premier_Set 0x1 /* exemple_catgets.msg:4 */ 

#define premier_chaine_l 0x1 /* exemple_catgets.msg:5 */ 

#define premier_chaine_2 0x2 /* exempl e_catgets .msg:6 */ 
$ 



718 



Programmation systeme en C sous Linux 



Nous pouvons maintenant compiler l'application et installer le fichier msg_catgets dans le 
repertoire /usr/share/1 ocal e/f r/LC_MESSAGES/ afin qu'il soit trouve par la bibliotheque C 
dans la localisation correspondante. 

$ Is msg_catgets 

msg_catgets 
$ su 

Password: 

# cp msg_citgets /usr/share/1 ocal e/f r/LC_MESSAGES/ 

# exit 

exit 

$ unset LC_ALL LC_MESSAGES LANG 
$ ./exemple_catgets 

This is the first string in the first set 

and here is the second string in the first set. 

Now let's have a look at the 1st string in 2nd set, 

and finaly the second string in the second set. 

$ export LANG=fr_FR 

$ ./exemple_catgets 

Ceci est la premiere chaine du premier ensemble, 
et voici la seconde chaine du premier ensemble. 
Maintenant voyons la lere chaine du 2eme ensemble, 
et finalement la seconde chaine du second ensemble. 
$ 

Nous voyons que ce mecanisme fonctionne tres bien mais qu'il est tres lourd a mettre en 
ceuvre dans le codage du programme, chaque manipulation de chaine devant faire Fobjet de 
verifications dans la nomenclature pour connaitre le nom ou le numero de l'ensemble et celui 
du message. 

II existe pourtant une alternative plus simple : les fonctionnalites GetText du projet Gnu. 

Catalogues de messages Gnu GetText 

Le principe des catalogues de messages GetText est d' employer la chaine originale comme cle 
d'acces dans le catalogue de traduction. Ainsi, il n'y a plus besoin de manipuler des identifi- 
cateurs, puisque la chaine se suffit a elle-meme. 

Le projet Gnu GetText est relativement ambitieux puisqu'il contient de nombreux outils pour 
aider a internationaliser des programmes qui n'etaient pas congus pour l'etre a l'origine. Nous 
allons simplement presenter ici les fonctionnalites qui concernent le programmeur desireux 
d'employer GetText comme une alternative plus pratique a catgets( ). 

L'ensemble de la traduction repose essentiellement sur l'emploi d'une unique fonction, 
nommee gettext( ), et declaree dans <1 i bi ntl . h> : 

char * gettext (const char * origine); 

L interface de cette routine se rapproche au maximum de celle que pourrait proposer - que 
proposera peut-etre un jour - un traducteur automatique. On lui transmet la chaine originale 
et elle renvoie un pointeur sur une zone de memoire statique contenant la traduction adaptee 
a la localisation de l'utilisateur. Si la traduction est impossible ou si la localisation est la 
meme que celle du concepteur du programme, le pointeur renvoye est identique a celui de 
la chaine transmise. 
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On peut done ecrire des choses comme : 

fprintf (stdout, gettextt "Vitesse : %d bits / sec \n"), vitesse); 

fprintf (stdout, gettextCParite = %s \n"), 

parite == PARITE_PAIRE ? gettext( "pai re" ) : gettext( "impai re" ) ) ; 

On peut traduire aussi bien des chaines de caracteres correspondant a des messages que des 
formats pour printf ( )par exemple. 

On devine que l'eventail des possibilites offertes par une telle interface est assez large. En 
effet, dans 1' implementation actuelle, la traduction est simplement recherchee dans un fichier, 
mais il est possible d'imaginer que la fonction gettext( ) peut evoluer pour interroger - par 
reseau - une enorme base de donnees ou un logiciel de traduction automatique. Dans le cas 
d'un portage sur un systeme ne supportant pas ce mecanisme, on definit simplement une macro 

#define gettext(X) (X) 

en tete de programme pour annuler la tentative de traduction. 

Pour que la bibliotheque puisse faire correspondre une traduction a un message, il faut lui 
indiquer le catalogue de messages a employer. Ceci s'effectue a l'aide de deux fonctions, 
textdomai n( ) et bindtextdomain( ). La bibliotheque GetText introduit en effet le concept de 
domaine, qui permet de scinder la base de textes en plusieurs fichiers. En general, une appli- 
cation n'utilise qu'un seul domaine, qu'elle configure des le demarrage du programme. Ceci 
s'effectue avec textdomai n() : 

char * textdomain (const char * domaine); 

Cette fonction signale a la bibliotheque que les messages ulterieurs seront recherches dans le 
domaine dont on passe le nom. Ce nom sera utilise pour determiner le fichier contenant les 
libelles des messages. La fonction bindtextdomain( ) permet d'indiquer le nom du repertoire 
dans lequel se trouve 1' arborescence des fichiers correspondant a un domaine particulier : 

char * bindtextdomain (const char * domaine, const char * repertoire); 

En fait, le fichier de traduction est recherche avec le chemin d'acces compose ainsi : 

/repertoi re_de_bindtextdomain( ) /local isation/LC_MESSAGES/domaine.mo 

Le repertoire de depart a ete specifie avec bindtextdomain( ). II s'agit en general de /usr/ 
share/locale. La localisation est extraite successivement des variables LANGUAGE, LC_ALL, LC_ 
MESSAGES et LANG. Le nom du fichier final est construit avec le nom de domaine et le suffixe .mo 
signifiant Machine Object. Ce fichier est binaire, compile par l'utilitaire /usr/bi n/msgfmt a 
partir du fichier de texte avec le suffixe .po signifiant Portable Object. 

Le projet GetText incorpore des macros pour permettre l'edition facile du fichier . po, mais 
son format est tellement simple que nous pourrons le manipuler directement. 

Nous allons utiliser le meme principe qu'avec exempl e_catgets, en prenant cette fois-ci les 
fonctionnalites GetText. 

exemple_gettext.c : 

finclude Oibintl .h> 
#include <stdio.h> 
#include <stdlib.h> 



720 



Programmation systeme en C sous Linux 



int 
main (void) 
{ 

textdomain( "exempl e_gettext" ) ; 

bindtextdomain( "exempl e_gettext" , "/ us r7 share/local e" ) ; 

printf (gettextCThis is the first string in the first set\n")); 
printf (gettext( "and here is the second string in the first set.\n")); 
printf ( 

gettext("Now let's have a look at the 1st string in 2nd set,\n")); 
printf (gettextt "and finaly the second string in the second setAn")); 
return EXIT_SUCCESS ; 

} 

On voit que l'impact sur le programme est beaucoup plus limite qu'avec catgets( ). L' appli- 
cation peut etre compilee et utilisee immediatement sans avoir a definir des constantes 
symboliques. Seules deux lignes ont ete ajoutees en debut de programme. Quant aux appels 
gettext( ), ils pourraient etre rendus encore plus discrets a l'aide d'une macro. 

Nous creons un fichier . po de traduction en francais : 
exemple_gettext.po : 

msgid "This is the first string in the first set\n" 
msgstr "Ceci est la premiere chaine du premier ensemble \n" 

msgid "and here is the second string in the first set.\n" 
msgstr "et voici la seconde chaine du premier ensemble. \n" 

msgid "Now let's have a look at the 1st string in 2nd set,\n" 
msgstr "A present regardons la lere chaine du 2eme ensemble, \n" 

msgid "and finaly the second string in the second set.\n" 
msgstr "et finalement la seconde chaine du second ensemble. \n" 

Ce fichier est construit avec des sequences successives utilisant le mot-cle msgid pour indi- 
quer la chaine originale et msgstr pour sa traduction. 

Nous allons compiler le fichier . po, puis nous l'installerons dans le repertoire systeme d' inter- 
nationalisation : 

$ export LC_ALL=fr_FR 
$ . /exempl e_gettext 

This is the first string in the first set 
and here is the second string in the first set. 
Now let's have a look at the 1st string in 2nd set, 
and finaly the second string in the second set. 
$ msgfmt -o exempl e_gettext. mo exempl e_gettext.po 
$ su 

Password: 

# cp exempl e_gettext. mo /usr/share/locale/fr/LC_MESSAGES/ 

# exit 

exit 

$ . /exempl e_gettext 
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Ceci est la premiere chaine du premier ensemble 

et voici la seconde chaine du premier ensemble. 

A present regardons la lere chaine du 2eme ensemble, 

et finalement la seconde chaine du second ensemble. 

$ unset LC_ALL 

$ ./exemple_gettext 

This is the first string in the first set 

and here is the second string in the first set. 

Now let's have a look at the 1st string in 2nd set, 

and finaly the second string in the second set. 

$ 

On remarque que le fichier a ete copie dans le repertoire de la localisation f r alors que la 
variable LC_ALL a ete configured avec f r_FR. La bibliotheque GetText recherche en effet intel- 
ligemment les fichiers de traduction disponibles. 

II est ainsi possible, de maniere simple, de traduire facilement les messages d'interface d'un 
logiciel. Le projet GetText contient egalement des utilitaires permettant d' analyser le fichier 
source d'une application existante, afin d'en extraire les chaines a traduire. Le fichier .po est 
alors construit automatiquement, et il ne reste plus qu'a le soumettre a un traducteur. 

II ne faut toutefois pas oublier que la traduction des messages n'est qu'une partie de l'interna- 
tionalisation d'un logiciel. De nombreuses conventions culturelles sont parfois aussi impor- 
tantes que la langue utilisee pour l'interface utilisateur. Si une application affiche le libelle 

This message was received on 03.04.2000 

et qu'on traduit uniquement le texte, obtenant ainsi 

Ce message a ete regu le 03.04.2000 

il y a de fortes chances pour que le lecteur francais lise 3 avril au lieu du 4 mars original. 

Un logiciel doit done pouvoir s'adapter aux regies d'usage decrites dans les autres categories 
de localisation. 



Configuration de la localisation 

Pour qu'une application soit sensible a la localisation, elle doit d'abord invoquer la fonction 
setl ocal e( ), declaree dans <1 ocal e . h> : 

char * setlocale (int categorie, const char * localisation); 

Cette routine demande a la bibliotheque C que toutes les fonctions manipulant des donnees en 
rapport avec la categorie precisee en premier argument prennent en compte le fait que 1' utili- 
sateur se trouve dans la localisation indiquee en second argument. 

La categorie est mentionnee sous forme d'une constante symbolique ayant le meme nom que 
les variables d'environnement decrites plus haut : LC_C0LLATE, LC_CTYPE, LC_MESSAGES, LC_ 
MONETARY, LC_NUMERIC, LC_TIME, et surtout LC_ALL. II n'y a pas de constante LANG, cette variable 
d'environnement etant utilisee comme valeur par defaut pour toutes les categories. II faut 
noter que dans l'avenir d'autres categories seront peut-etre ajoutees, et qu'il en existe deja 
d'autres sur certains systemes. 
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La localisation indiquee en second argument peut prendre l'une des formes suivantes : 

• Une chaine de caracteres construite sur le meme modele que le contenu des variables 
d'environnement ci-dessus (par exemple "fr_FR"). 

• Une chaine renvoyee par un appel precedent a setl ocal e( ), comme nous le decrirons plus 
bas. 

• Les chaines speciales "POSIX" ou "C" , qui demandent a la bibliotheque d' adopter le compor- 
tement decrit exactement dans ces standards, sans s'occuper des variations dues a la localisa- 
tion. II s'agit en fait d'une commande d'anti-internationalisation, assurant que le programme 
fournisse partout le meme resultat. Nous reviendrons egalement sur cette option. 

• La chaine vide "", qui demande a la bibliotheque d' adopter le comportement adapte a la 
localisation configuree par l'utilisateur dans ses variables d'environnement. 

En fait, c'est bien entendu la derniere forme qui est la plus utilisee. II me semble d'ailleurs 
n'avoir jamais invoque setl ocal e( ) dans une application avec d'autres arguments que 

setl ocal e (LC_ALL, ""); 

qui reclament de la bibliotheque C une adaptation de ses fonctionnalites, dans toutes les cate- 
gories, suivant la localisation choisie par l'utilisateur. 

Si on n'appelle pas setl ocal e( ), le comportement de la bibliotheque C est le meme qu'en 
ayant invoque setl ocal e (LC_ALL, "C"), qui ne presente done pas d'interet. Par contre, les 
localisations "C" et "POSIX" peuvent etre utiles pour configurer une categorie particuliere. 

Par exemple, une application peut autoriser un utilisateur a employer ses preferences en termes 
de langage, de presentation de la date ou de classification des caracteres accentues, mais 
imposer que les saisies de nombres reels se fassent en employant le point comme separateur 
decimal. Ceci afin de pouvoir relire automatiquement des fichiers de donnees deja construits. 
On emploiera alors une sequence : 

setl ocal e (LC_ALL, ""); 
setlocale (LC_NUMERIC, "C"); 

Ce genre de restriction peut aussi s'appliquer a la categorie LC_CTYPE pour les programmes 
qui s'appuient fortement sur les correspondances entre les caracteres Ascii et leurs valeurs 
numeriques. 

Le fait de configurer directement une localisation avec une chaine explicite ne se justifie que 
si l'application est lancee sans que les variables d'environnement n'aient pu etre configurees 
par le shell (un demon comme xdm). On laissera alors l'utilisateur inscrire ses preferences dans 
un fichier de configuration, et l'application devra invoquer setl ocal e( ) avec la chaine indiquee. 

Lorsqu'on passe un argument NULL en seconde position de setl ocal e( ), cette fonction renvoie 
un pointeur sur une chaine de caracteres decrivant la localisation actuelle pour la categorie 
concernee. Cette chaine peut etre copiee pour une utilisation ulterieure, au besoin. Le poin- 
teur est dirige vers une zone de memoire statique interne a la bibliotheque, qui risque d'etre 
ecrasee par la suite, et qu'il faut done copier si on desire la conserver. Si on reclame la valeur 
de LC_ALL, la chaine renvoyee peut prendre differents formats, car elle represente 1' ensemble 
des categories (qui peuvent etre configurees avec des localisations differentes). Cette chaine 
n'est pas obligatoirement intelligible - quoique ce soit apparemment le cas avec la GlibC -, 
mais elle pourra dans tous les cas etre reemployee comme second argument d'un appel 
setl ocal e() ulterieur. 
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Voici un programme qui va afficher Fetat des localisations programmees : 
exemple_setlocale.c : 

#include <locale.h> 
#include <stdio.h> 
^include <stdlib.h> 

int 
main (void) 

{ 

setlocale(LC_ALL, ""); 



printf ("LC_COLLATE = 


Zs 


\n". 


setl ocal e( LC_ 


.COLLATE, 


MULL)) 


printf("LC_CTYPE 


%s 


\n". 


setl ocal e( LC_ 


_CTYPE, 


MULL)) 


printf ("LC_MESSAGES = 


Zs 


\n". 


setl ocal e( LC_ 


.MESSAGES, 


MULL) ) 


printf ("LC_MONETARY = 


%s 


\n". 


setl ocal e( LC_ 


.MONETARY, 


MULL) ) 


printf ("LC_NUMERIC = 


%s 


\n". 


setl ocal e( LC_ 


.NUMERIC, 


MULL) ) 


printf("LC_TIME 


Zs 


\n". 


setl ocal e( LC_ 


.TIME, 


MULL) ) 


printf("LC_ALL 


Zs 


\n". 


setl ocal e(LC_ALL, 


MULL)) 



return EXIT_SUCCESS; 

} 

En fait, l'execution nous permet de verifier que la localisation par defaut est "C", et que les 
localisations respectent la hierarchie LANG < LC_xxx < LC_ALL. 

$ unset LANG LC_ALL 
$ . /exemple_setlocale 

LC_COLLATE = C 
LC_CTYPE = C 
LC_MESSAGES = C 
LC_MONETARY = C 
LC_NUMERIC = C 
LC_TIME = C 
LC_ALL = C 

$ export LANG=fr_FR 
$ . /exemple_setlocale 
LC_COLLATE = fr_FR 
LC_CTYPE = fr_FR 
LC_MESSAGES = fr_FR 
LC_MONETARY = fr_FR 
LC_NUMERIC = fr_FR 
LC_TIME = fr_FR 
LC_ALL = fr_FR 

$ export LC_CTYPE=fr_CA 
$ . /exemple_setlocale 
LC_COLLATE = fr_FR 
LC_CTYPE = fr_CA 
LC_MESSAGES = fr_FR 
LC_MONETARY = fr_FR 
LC_NUMERIC = fr_FR 
LC_TIME = fr_FR 

LC_ALL = LC_CTYPE=f r_CA; LC_NUMERIC=f r_FR; LC_TIME=f r_FR; LC_COLLATE=f r_FR; 

LC_MONETARY=f r_FR; LC_MESSAGES=f r_FR 
$ export LC_MONETARY=fr_BE 
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$ ./exemple_setlocale 

LC_COLLATE = fr_FR 
LC_CTYPE = fr_CA 
LC_MESSAGES = fr_FR 
LC_MONETARY = fr_BE 
LCJIUMERIC = fr_FR 
LC_TIME = fr_FR 

LC_ALL = LC_CTYPE=f r_CA; LC_NUMERIC=f r_FR; LC_TIME=f r_FR; LC_COLLATE=f r_FR; 

LC_MONETARY=f r_BE; LC_MESSAGES=f r_FR 

$ export LC_ALL=es_ES 

$ ./exemple_setlocale 

LC_COLLATE = es_ES 

LC_CTYPE = es_ES 

LC_MESSAGES = es_ES 

LC_MONETARY = es_ES 

LCJIUMERIC = es_ES 

LC_TIME = es_ES 

LC_ALL = es_ES 

$ 

Localisation et fonctions de bibliotheques 

Une fois que la localisation a ete definie pour une ou plusieurs categories, certaines fonctions 
de bibliotheque modifient leur comportement pour s' adapter aux coutumes en usage chez 
l'utilisateur. L' application peut continuer a utiliser printf ( ) , par exemple pour afficher des 
reels, mais le symbole employe pour afficher le separateur decimal sera modifie. Notons que 
pri ntf ( ) ne permet pas de separer les chiffres par milliers, au contraire de strfmon ( ) que nous 
etudierons plus loin. 

Le programme suivant affiche la valeur numerique 2000,01 avec les variations dues a la 
localisation : 

exemple_numeric.c : 

#1nclude <locale.h> 
#include <stdio.h> 
#include <stdlib.h> 

int 

main (int argc, char * argv[]) 
{ 

double d = 2000.01; 
setlocale(LC_ALL, ""); 
fprintf(stdout. "*.2f\n", d); 
return EXIT_SUCCESS ; 

} 

L' execution nous montre que seul le point decimal est modifie : 

$ unset LC_ALL LANG LCJIUMERIC 
$ . /exemple_numeric 

2000.01 
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$ export LANG=fr_FR 
$ ./exemple_numeric 

2000,01 
$ 

De nombreuses routines sont affectees par les categories LC_CTYPE et LC_C0LLATE , qui concer- 
nent les caracteres manipules par le programme. Dans le chapitre 15, nous avons examine le 
comportement des fonctions strcasecmp( ), strcol 1 ( ) ou strxf rm( ) vis-a-vis de la localisa- 
tion, et nous avons remarque que les resultats pouvaient varier grandement suivant le jeu de 
caracteres utilise. 

Dans le chapitre 25, nous avons observe aussi que plusieurs fonctions de manipulation des 
dates etaient sensibles a la localisation via la categorie LC_TI ME. Cela concerne aussi bien 
Faffichage avec strftimeO par exemple que la saisie avec getdateO. On peut s'en rendre 
egalement compte avec le comportement de Futilitaire /bi n/date en l'invoquant avec l'argu- 
ment "%A %x", qui lui demande d'afficher le nom du jour de la semaine, suivi de la date 
complete. 

$ unset LANG LC_TIME LC_ALL 
$ date +"%A %x" 

Wednesday 03/08/00 

$ export LC_TIME=fr_FR 

$ date +"%A %x" 

mercredi 08.03.2000 
$ 

Pour afficher des valeurs monetaires, pri ntf ( ) n'est pas vraiment adapte car il ne prend pas 
en compte le symbole de la monnaie du pays ni certaines coutumes comme la separation des 
valeurs par milliers. Pour le remplacer dans ce role, il existe une fonction nommee strfmon( ), 
declaree dans <monetary.h> : 

ssize_t strfmon (char * buffer, size_t taille, char * format, ...); 

Cette fonction utilise le format indique en troisieme argument et convertit les donnees a sa 
suite, en stockant le resultat dans le premier argument, dont la taille maximale est indiquee en 
seconde position. Cette routine se comporte done un peu comme snprintfO, mais elle 
renvoie le nombre de caracteres inscrits dans le buffer. La chaine de format peut comprendre 
des caracteres normaux, qui seront recopies directement, ou des indicateurs de conversion 
commencant par le caractere %. Les conversions possibles sont : 



Code 


Type d'argument 


Signification 


%\ 


doubl e 


Representation locale d'une valeur monetaire representee sous sa forme Interna- 
tionale. 


%n 


doubl e 


Representation locale d'une valeur monetaire representee sous sa forme nationale. 


%% 




Affichage du caractere %. 



Entre le % et le code de conversion peuvent se trouver plusieurs champs : 

• un attribut precisant le formatage du nombre ; 

• la largeur minimale de la representation de la valeur ; 
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• un symbole // suivi de la largeur minimale de la partie entiere, sans compter les eventuels 
separateurs de milliers ; 

• un point suivi du nombre de decimales a afficher. 
L'attribut de formatage peut prendre les formes suivantes : 



Code Signification 

=<caractere> Le caractere indique sera employe pour remplir les blancs avant le nombre lorsque le resultat est 
plus petit que la longueur minimale demandee. En general le caractere par defaut, espace, suffit. 
Parte, on peut preferer des zeros ou des points. 

! Ne pas afficher le symbole de la monnaie. 

Ne pas afficher les separateurs des milliers. 

Aligner les nombres a gauche plutot qu'a droite. 
+ Les valeurs sont precedees de leur signe, positif ou negatif. 

( Les valeurs negatives sont entourees de parentheses. Cet attribut ne peut pas etre employe en 

meme temps que le precedent. 



Le programme suivant va appeler strfmonO avec les arguments passes sur sa ligne de 
commande. 

exemple_strfmon.c : 

//include <locale.h> 
//include <monetary.h> 
//include <stdio.h> 
//include <stdlib.h> 

int 

main (int argc, char * argv[]) 
{ 

double d; 

char buffer[80]; 

setlocale (LC_ALL, ""); 
if ((argc != 3) 
|| (sscanf(argv[2], "%lf", & d) != 1) ) { 

fprintf (stderr, "%s format valeur \n", argv[0]); 

exit(EXIT_FAILURE); 

} 

if (strfmon(buffer, 80, argv[l], d) >0) 

fprintf (stdout, "Js\n", buffer); 
return EXIT_SUCCESS ; 

} 

Nous allons tout d'abord observer les effets de la localisation sur une valeur donnee : 

$ unset LC_ALL LC_M0NETARY LANG 
$ . /exemple_strfmon "%n" 1500 

1500.00 



International isation 

Chapitre 27 

$ export LC_MONETARY=fr_FR 
$ ./exemple_strfmon "%n" 1500 

1 500,00 EUR 
$ ./exemple_strfmon 1500 

1 500,00 EUR 
$ export LC_M0NETARY=fr_CH 
$ ./exemple_strfmon "%n" 1500 
Fr. 1 500.00 

$ ./exemple_strfmon 1500 

CHF 1 500.00 

$ export LC_M0NETARY=en_US 
$ ./exemple_strfmon "%n" 1500 

$1,500.00 
$ ./exemple_strfmon 1500 

USD 1,500.00 

$ 

On remarque la difference entre les representations nationales et internationales des monnaies, 
definies par la norme ISO-4217. Le separateur des milliers varie aussi. Nous allons observer 
les remplissages en tete des nombres : 

$ ./exemple_strfmon "%=0#4.2n" 150 

00150,00 EUR 

$ ./exemple_strfmon "%=0#4.2n" 1500 

1 500,00 EUR 

$ ./exemple_strfmon "%=0#4.2n" 15000 

15 000,00 EUR 

$ ./exemp1e_strfmon "%=0 A #4.2n" 150 

0150.00 EUR 

$ ./exemple_strfmon "%=0 A #4-2n" 1500 

1500,00 EUR 

f 

Nous voyons que lors du remplissage, la largeur de la partie decimale est completee avec des 
zeros, y compris l'espace entre les milliers. Ce comportement permet un alignement correct, 
que la localisation autorise un separateur de milliers ou non. Nous voyons aussi que la largeur 
indiquee n'est qu'un minimum, car lors de la troisieme execution, la valeur n'est pas tronquee. 
Regardons a present l'effet des indicateurs de signe : 

$ ./exemp1e_strfmon "%n" -1500 

-1 500,00 EUR 

$ ./exemple_strfmon "%+n" -1500 

-1 500,00 EUR 

$ ./exemple_strfmon "%+n" 1500 

1 500,00 EUR 
$ ./exemple_strfmon "%(n" 1500 

1 500,00 EUR 
$ ./exemple_strfmon "%(n" -1500 
(1 500,00 EUR) 



Nous laisserons le lecteur experimenter lui-meme les differentes possibilites, en precisant que 
le caractere '!' peut poser des problemes avec certains shells et qu'il est preferable pour 



728 



Programmation systeme en C sous Linux 



l'utiliser de basculer sur un interpreteur ne l'employant pas, comme ksh, plutot que de 
compliquer la chaine de format pour proteger le caractere : 

$ ksh 

% ./exemple_strfmon "%!n" 1500 

1 500,00 
% ./exemple_strfmon "%n" 1500 

1 500,00 EUR 
% exit 
$ 

En fait, strfmon( ) ne sait manipuler que des valeurs monetaires, tout comme strftime( ) ne 
traite que des dates et des heures. Si la chaine finale doit contenir d'autres conversions, on 
peut se servir de strfmonO pour construire la chaine de format qui sera employee dans 
printf ( ). En voici un exemple. 

exemple_strfmon 2.c : 

//include <locale.h> 
//include <monetary.h> 
//include <stdio.h> 
//include <stdlib.h> 

int 
main (void) 
{ 

int quantite[] = { 

1, 4, 3, 1, 1, 2, 0 

}; 

char * referenced = { 

"ABC", "DEF" , "GHI" , "JKL" , "MN0" , "PQR" , NULL 

}; 

double prix[] = { 

1500, 2040, 560, 2500, 38400, 125, 0 

}; 

int i ; 

char format[80] ; 
double total = 0.0; 

setlocale(LC_ALL, ""); 

for (i = 0; reference[i] != NULL; i ++) { 

strfmon(format, 80, "H5S : W/5n x %%d = %//5n\n", 
prix[i], prix[i] * quantite[i ] ) ; 

fprintf (stdout, format, referenc [i], quantite[i ] ) ; 

total += prix[i] * quantite[i]; 

} 

strfmon(format, 80, " Total = W/5n\n", total); 

fprintf (stdout, format); 
return EXIT_SUCCESS; 

} 



Internationalisation 

Chapitre 27 



La chaine de format transmise a f pri ntf ( ) permet d'afficher un libelle et un nombre de pieces. 

$ unset LC_ALL LC_MONETARY LANG 
$ export LC_MONETARY=fr_FR 
$ ./exemple_strfmon_2 

ABC : 1 500, 00€ x 1 = 1 500. 00€ 

DEF : 2 040, 00€ x 4 = 8 160, 00€ 

GHI : 560, 00€ x 3 = 1 680, 00€ 

JKL : 2 500, 00€ x 1 = 2 500, 00€ 

MN0 : 38 400, 00€ x 1 = 38 400. 00€ 

PQR : 125, 00€ x 2 = 250, 00€ 
Total = 52 490, 00€ 
$ export LC_MONETARY=en_GB 
$ ./exemple_strfmo n_2 

ABC : £ 1,500.00 x 1 = £ 1,500.00 

DEF : £ 2,040.00 x 4 = £ 8,160.00 

GHI : £ 560.00 x 3 = £ 1,680.00 

JKL : £ 2,500.00 x 1 = £ 2,500.00 

MN0 : £38,400.00 x 1 = £38,400.00 

PQR : £ 125.00 x 2 = £ 250.00 
Total = £52,490.00 

$ 

Localisation et fonctions personnelles 

II peut arriver qu'une application ait a construire elle-meme la representation locale d'une 
valeur numerique ou monetaire, sans que la fonction strfmon( ) soit suffisante. On peut par 
exemple avoir besoin de connaitre le symbole monetaire employe localement pour l'afficher 
en tete de colonne d'une facture. 

Informations numeriques et monetaires avec localeconvQ 

II existe une fonction nommee local econv( ), definie comme setl ocal e( ) par le standard Iso 
C, et declaree dans <1 ocal e . h> ainsi : 

| struct lconv * localeconv (void); 

Cette routine renvoie un pointeur sur une zone de donnees statiques, interne a la bibliotheque, 
susceptible d'etre modifiee, et qu'il ne faut pas ecraser. La structure 1 conv renvoyee contient 
les membres suivants : 



Norn 


Type 


Signification 


decimal_point 


char * 


Chaine contenant le caractere employe comme separateur decimal. Par defaut, 
il s'agit du point. 


thousands_sep 


char * 


Chaine comportant le caractere employe comme separateur des milliers. Par 
defaut, la chaine est vide. 


mon_decimal_point 


char * 


Comme decimal_point, mais applique uniquement aux valeurs monetaires. 


mon_thousands_sep 


char * 


Comme thousands_sep pour les valeurs monetaires. 


currency_symbol 


char * 


Symbole monetaire pour des echanges nationaux. 
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Nom Type Signification 



int_curr_symbol 


char * 


Symbole monetaire pour des echanges internationaux. Conforme a la norme 


positive_sign 


char * 


Signe employe pour les valeurs monetaires positives. Par defaut, cette chaine 
est vide. 


negative_sign 


char * 


Signe utilise pour les valeurs monetaires negatives. Si cette chaine est vide, 
comme c'est le cas par defaut, et si le membre precedent est egalement vide, 
il taut employer 


frac_digits 


char 


Nombre de decimales a afficher dans une representation monetaire nationale. 
La valeur par defaut, CHAR_MAX, signifie que le comportement n'est pas precise. 


int_f rac_digits 


char 


Nombre de decimales a afficher dans une representation monetaire interna- 
tionale. La valeur par defaut, CHAR_MAX, signifie que le comportement n'est pas 
precise. 


p_cs_precedes 


char 


Ce membre vaut 1 si le symbole monetaire doit preceder une valeur positive, 0 
s'il doit la suivre, et CHAR_MAX si le comportement n'est pas precise. 


p_sep_by_space 


char 


Ce membre vaut 1 si le symbole monetaire doit etre separe d'une valeur 
positive par un espace, 0 sinon, et CHAR_MAX si le comportement n'est pas 
precise. 


p_s 1 gn_posn 


char 


Ce champ peut prendre les valeurs suivantes '. 

0 si aucun signe n'est affiche devant une valeur positive ; 

1 si le signe doit preceder une valeur positive et son symbole ; 

2 si le siqne doit suivre la valeur positive et le symbole ; 

3 si le signe doit se trouver immediatement avant le symbole ; 

4 si le signe doit se trouver immediatement apres le symbole. 


n_cs_precedes 


char 


Comme p_cs_precedes, pour une valeur negative. 


n_sep_by_space 


char 


Comme p_sep_by_space, pour une valeur negative. 


n_sign_posn 


char 


Ce champ est equivalent a p_sign_posn pour des valeurs negatives, mais 
s'il vaut 0, la valeur negative et son symbole doivent etre encadres par des 
parentheses. 



Le programme suivant affiche les informations de la structure 1 conv correspondant a la loca- 
lisation en cours. 

exemplejocaleconv.c : 

//include <locale.h> 
#include <stdio.h> 
//include <stdlib.h> 

int 
main (void) 
{ 

struct lconv * lconv; 

setlocale(LC_ALL, ""); 
1 conv = 1 ocal econv( ) ; 
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printf ( 


"decimal_point 


= %s 


\n", 


1 conv 


->decimal_point) ; 


printf ( 


"thousands_sep 


= %s 


\n". 


1 conv 


->thousands_sep) ; 


printf ( 


"mon_deciirial_point 


= %s 


\n". 


1 conv 


->mon_decimal_point) 


printf! 


"mon_thousands_sep 


= %s 


\n", 


1 conv 


->mon_thousands_sep) 


printf! 


"currency_symbol 


= %s 


\n", 


1 conv 


->currency_symbol ) ; 


printf! 


"int_curr_symbol 


= %s 


\n". 


1 conv 


->int_curr_symbol ) ; 


printf! 


"positive_sign 


= %s 


\n", 


1 conv 


->positive_sign) ; 


printf! 


"negative_sign 


= %s 


\n", 


1 conv 


->negative_sign) ; 


printf! 


"frac_digits 


= %d 


\n", 


1 conv 


->f rac_digits) ; 


printf! 


"int_f rac_digits 


= %i 


\n". 


1 conv 


->int_frac_digits) ; 


printf! 


"p_cs_precedes 


= %d 


\n". 


1 conv 


->p_cs_precedes) ; 


printf! 


"p_sep_by_space 


= %d 


\n", 


1 conv 


->p_sep_by_space) ; 


printf! 


"p_sign_posn 


= %d 


\n", 


1 conv 


->p_sign_posn) ; 


printf! 


"n_cs_precedes 


= U 


\n", 


1 conv 


->n_cs_precedes) ; 


printf! 


"n_sep_by_space 


= %d 


\n", 


1 conv 


->n_sep_by_space) ; 


printf! 


"n_sign_posn 


= %d 


\n", 


1 conv 


->n_sign_posn) ; 


return 


EXIT_SUCCESS; 











} 

Rappelons qu'une valeur CHAR_MAX (127) dans un champ de type char signifie que l'informa- 
tion n'est pas disponible. 

$ unset LC_ALL LANG 
$ ./exemple_localeconv 

decimal_point = . 
thousands_sep 
mon_decimal_point = 
mon_thousands_sep = 
currency_symbol 
int_curr_symbol 
positive_sign 
negative_sign 
frac_digits = 127 

int_f rac_digits = 127 
p_cs_precedes = 127 
p_sep_by_space = 127 
p_sign_posn = 127 

n_cs_precedes = 127 
n_sep_by_space = 127 
n_sign_posn = 127 

$ export LC_ALL=fr_FR 
$ ./exemple_localeconv 
decimal_point = , 
thousands_sep 
mon_decimal_point = , 
mon_thousands_sep = 
currency_symbol = EUR 
int_curr_symbol = EUR 
positive_sign 
negative_sign = - 
frac_digits = 2 
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int_f rac_digits 
p_cs_precedes 
p_sep_by_space 
p_sign_posn 



2 
0 
1 
1 
0 
1 
1 



n_cs_precedes 

n_sep_by_space 

n_sign_posn 



$ export LC_ALL=en_US 
$ ./exemple_localeconv 

decimal_point = . 
thousands_sep = , 
mon_decimal_point = . 
mon_thousands_sep = , 
currency_symbol = $ 
int_curr_symbol = USD 
positive_sign 
negative_sign = - 
frac_digits = 2 

int_frac_digits = 2 
p_cs_precedes = 1 
p_sep_by_space = 0 
p_sign_posn = 1 

n_cs_precedes = 1 
n_sep_by_space = 0 
n_sign_posn = 1 



Informations completes avec nl_langlnfo() 

II apparait a l'usage que la fonction 1 ocal econv( ) n'est pas suffisante pour obtenir toutes les 
informations pertinentes concernant la localisation. La limitation aux valeurs numeriques et 
monetaires est tres restrictive par rapport au contenu complet des donnees localisees. Impos- 
sible en effet d'avoir acces aux noms des mois sans passer par strf ti me ( ), ou encore de verifier 
si la reponse d'un utilisateur est affirmative ou negative. 

Une autre fonction a done ete definie, un peu moins portable que 1 ocal econv( ) car elle n'est 
pas dans la norme ISO C. Nominee ni l anginfo( ), elle se trouve quand meme dans les speci- 
fications Unix 98. Sa declaration se trouve dans <1 angi nf o . h> : 

char * nl_langinfo (nl_item objet); 

Le type nl_item est numerique, il est defini dans <nl_types . h>. Cette routine renvoie un poin- 
teur sur une chaine de caracteres contenant la representation locale de l'objet demande. 
Contrairement a 1 ocal econv( ), la fonction nl_l angi nfo( ) permet done de reclamer unique - 
ment les informations qui nous interessent. 

La chaine de caracteres renvoyee se trouve dans une zone de memoire statique, susceptible 
d'etre ecrasee a chaque appel. L'argument de cette routine est une valeur numerique, qu'on 
choisit parmi les constantes symboliques suivantes, definies dans <1 angi nf o . h> : 



$ 
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Nom 


Categorie 


Signification 


YESEXPR, NOEXPR 


LC_MESSAGES 


Chalne representant une reponse affirmative ou negative. 


MON_DECIMAL_POINT 


LC_MONETARY 


Significations identiques a celles des champs ayant les memes noms 


MON_THOUSANDS_SEP 




dans la structure 1 conv fournie par 1 ocal econv( ). 


CURRENCY_SYMBOL 






INT_CUR_SYMBOL 






POSITIVE_SIGN 






NEGATI VE_SIGN 






FRAC_DIGITS 






INT_FRAC_DIGITS 






P_CS_PRECEDES 






P_SEP_BY_SPACE 






P_SIGN_POSN 






N_CS_PRECEDES 






N_SEP_BY_SPACE 






N_SIGN_POSN 






DEC IMAL_P0I NT 


LC_NUMERIC 




THOUSANDS_SEP 






ABDAY_1 ... ABDAY_7 


LC_TIME 


Abreviations des noms des jours de la semaine. 


ABM0N_1 ... ABM0N_12 




Abreviations des noms des mois. 


DAY_1 ... DAY_7 




Noms des jours de la semaine. 


M0N_1 ... M0N_12 




Nom des mois. 


AM_STR, PM_STR 




Chalnes representant les symboles AM et PM. 


D_FMT , D_T_FMT 




Formats pour strftimeO afin d'obtenir la date seule, ou la date 
et I'heure. 


T_FMT, T_FMT_AMPM 




Formats pour avoir I'heure, eventuellement avec les symboles AM 
etPM. 



II existe quelques autres objets dans la categorie LC_TIME, si la localisation supporte un second 
calendrier. Ceci est rarement utilise, et on laissera le lecteur se reporter a la documentation 
Gnu s'il a besoin de ces fonctionnalites. 

Le programme suivant affiche le contenu des champs qui n'etaient pas de finis dans la struc- 
ture 1 conv. 

exemple_nl langinfo.c : 

#include <langinfo.h> 
#include <locale.h> 
#include <stdio.h> 



int 
main (void) 

{ 
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int i; 

char * li belles [] = { 

"YESEXPR" , "NOEXPR", 
"ABDAY_1" , "ABDAY_7" , 
"ABM0N_1", "ABM0N_12", 
" DAY_1 " , " DAY_7 " , 
"M0N_1", "M0N_12", 
"AM_STR" , "PM_STR", 
"D_FMT" , "D_T_FMT" , 
"T_FMT" , "T_FMT_AMPM" , 
NULL 

}; 

nl_item objet [] = ( 

YESEXPR, NOEXPR, 
ABDAY_1, ABDAY_7, 
ABM0N_1. ABM0N_12, 
DAY_1 , DAY_7 , 
M0N_1, M0N_12, 
AM_STR, PM_STR, 
D_FMT , D_T_FMT, 
T_FMT , T_FMT_AMPM, 
0 

}; 

setlocale (LC_ALL, ""); 
for (i = 0; libelles [i] != NULL; i ++) 
fprintf (stdout. "%10s = \"%s\" \n", 

libelles [1], nl_langinfo (objet [i])); 

return (0); 

} 

Nous n'affichons pas tous les jours de la semaine ni tous les mois. 

$ unset LC_ALL LANG 
$ ./exemple_nl_langinfo 



YESEXPR 




" A [y Y] " 


NOEXPR 




■A[ nN ]- 


ABDAY_1 




"Sun" 


ABDAY_7 




"Sat" 


ABM0N_1 




"Jan" 


ABM0M_12 




"Dec" 


DAY_1 




"Sunday" 


DAY_7 




"Saturday" 


M0N_1 




"January" 


M0N_12 




"December" 


AM_STR 




"AM" 


PM_STR 




"PM" 


D_FMT 




"%m/%d/%y" 


D_T_FMT 




"%a %b %e %H:%M:%S 


T_FMT 




"%»:%»:%S" 


FMT_AMPM 




"%I :%M:%S %p" 



$ 

$ export LC_ALL=fr_FR 
$ . /exemple_nl_langinfo 
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YESEXPR 


= 


"*[oOyY].*" 


NOEXPR 


= 


,A [nN].*" 


ABDAY_1 




"dim" 


ABDAY_7 


= 


"sam" 


ABMONJL 


= 


"jan" 


ABM0N_12 




"dec" 


DAY_1 


= 


"dimanche" 


DAY_7 


= 


"samedi " 


M0N_1 


- 


"janvier" 


M0N_12 




"decembre" 


AM_STR 






PM_STR 






D_FMT 




"%d.%m.%1" 


D_T_FMT 




"2Sa %d %b % 


T_FMT 




"11" 


T_FMT_AMPM 







$ 

Nous voyons ainsi qu'on peut obtenir toutes les informations pertinentes concernant les diffe- 
rentes categories de localisation susceptibles d'etre employees dans une application. 



Conclusion 

Avec les possibilites de traduction des messages d'interface, en employant la bibliotheque 
Gnu GetText et en s'appuyant sur les fonctionnalites offertes par nl_l anginfo( ), une applica- 
tion peut pretendre a une veritable portee internationale. 

La documentation Gnu, principalement celle de la bibliotheque GetText, offre des informa- 
tions complementaires qui interesseront les developpeurs confrontes a des situations plus 
complexes que celles qui ont ete decrites ici. 

Ayant examine depuis quelques chapitres les manipulations possibles sur les donnees four- 
nies par le systeme, nous allons changer totalement de sujet, en abordant une nouvelle partie 
consacree a l'ensemble des possibilites de communication entre les processus, y compris la 
programmation reseau. 
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Des qu'une application depasse un certain degre de complexite pour ce qui concerne les fonc- 
tionnalites independantes, on peut etre tente de la scinder en plusieurs entites distinctes, sous 
forme de processus par exemple. 

Prenons le cas d'une base de donnees offrant des possibilites de consultation par l'interme- 
diaire de connexions TCP/IP. On peut diviser cette application en plusieurs taches indepen- 
dantes. Le noyau principal s'occupe de superviser la base de donnees elle-meme, en gerant 
notamment les problemes d'acces simultanes. Un second module assure l'ecoute des demandes 
de connexion et leurs initialisations. Enfin, on peut imaginer disposer d'une multitude de 
copies d'un dernier module, charge du deroulement complet de la liaison avec le client, y 
compris l'interface de dialogue. 

Pour construire ce genre de systeme, plusieurs options se presentent : 

• Un seul processus s'occupe de tous les travaux. On conserve en memoire une copie des 
donnees necessaires au suivi de la connexion pour chaque client. Le processus bascule 
d'une fonction a l'autre au gre des requetes grace a l'appel-systeme selectO que nous 
etudierons dans un prochain chapitre. 

• On utilise un systeme a base de threads, Faeces aux informations globales de la base de 
donnees devant etre strictement regi par des mutex. Les donnees propres a chaque 
connexion sont conservees dans des variables locales de la routine centrale du thread de 
communication. 

• On scinde l'application en plusieurs processus, le noyau principal restant a l'ecoute des 
requetes de ses fils. Chaque module de communication est represente par un processus 
independant dote de ses donnees propres, dialogue avec le client sur une liaison reseau et 
avec le noyau central par l'intermediaire de l'une des differentes methodes que nous allons 
etudier dans ce chapitre. 
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Finalement, chacune de ces methodes a des avantages et des defauts : 

• Le processus unique est plus facilement portable sur d'autres systemes qu'Unix mais, en 
contrepartie, l'ecriture et la maintenance de cette application sont plus compliquees car des 
fonctionnalites sans rapport entre elles sont regroupees dans le meme logiciel. 

• La combinaison de plusieurs threads offre une grande souplesse et une bonne portability, 
mais l'independance des modules n'est qu'illusoire. Lors d'une evolution du logiciel 
initial, Faeces a des donnees globales peut engendrer subitement des bogues difficiles a 
decouvrir. 

• La division en plusieurs processus permet d' avoir des modules vraiment independants, 
devant simplement se plier a une interface bien dehnie. Par contre, le systeme est depen- 
dant de F architecture Unix, et la creation d'un nouveau processus pour chaque connexion 
peut parfois etre penalisante. 

Dans la premiere partie de ce chapitre nous allons examiner le moyen de communication le 
plus simple pour deux processus issus de la meme application (pere et his, ou freres) : les 
tubes. 

II y a egalement des cas oil l'ensemble applicatif repose sur plusieurs logiciels totalement 
independants. Ces programmes doivent disposer d'un autre moyen de communication 
puisque les tubes ne leur sont plus adaptes. Linux offre alors le concept de tubes nommes, qui 
sont concus pour cette situation, et que nous observerons en seconde partie. 

Nous nous limitons pour le moment aux communications entre deux processus residant dans 
le meme systeme. Lorsqu'on veut faire dialoguer des logiciels se trouvant sur des stations 
differentes, il faut employer des methodes que nous examinerons dans les chapitres traitant de 
la programmation reseau (mais qui ne different par ailleurs pas beaucoup des principes 
etudies ici). 

Les tubes 

Un tube de communication est un tuyau dans lequel un processus ecrit des donnees qu'un 
autre processus peut lire. Le tube est cree par l'appel-systeme pipeO, declare dans 
<unistd. h> : 

int pipe (int descripteur [2]); 

Lorsqu'elle reussit, cette fonction cree un nouveau tube au sein du noyau et remplit le tableau 
passe en argument avec les descripteurs des deux extremites. Etant donne que le langage C 
passe les arguments du type tableau par reference, la routine pi pe ( ) recoit un pointeur sur la 
table et peut done ecrire dans les deux emplacements reserves. Les descripteurs correspon- 
dent respectivement a la sortie et a l'entree du tube. 

La situation est resumee sur la figure 28.1. 

Le tube est entierement sous le controle du noyau. II reside en memoire (et pas sur le disque), 
et le processus recoit les deux descripteurs correspondant a l'entree et a la sortie du tube. Le 
descripteur d'indice 0 est la sortie du tube, il est ouvert en lecture seule. Le descripteur 1 est 
l'entree ouverte en ecriture seule. 

Nous observons en effet que les tubes sont des systemes de communication unidirectionnels. 
Si on desire obtenir une communication complete entre deux processus, il faut creer deux 
tubes et les employer dans des sens opposes. 
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Figure 28.1 

Tube de communication 




Entree 



Sortie 



writeQ 



read() 



Processus 



Dans notre premier exemple, nous allons simplement creer un tube, ecrire des donnees dedans, 
lire son contenu et verifier que les informations sont identiques. 

exemple_pipe_1.c : 

#include <stdio.h> 
#include <unistd.h> 



for (i = 0; i < 256; 1 ++) 

buffer[i] = i; 
fprintf (stdout, "Ecriture dans tube \n"); 
if Cwn'te(tube[l], buffer, 256) != 256) { 

perror( "write" ) ; 

exi t( EXIT_FAI LURE) ; 



f pri ntf ( stdout , "Veri f i cati on . . . " ) ; 
for (i = 0; i < 256; i ++) 
if (buffer[i] != i) { 

fprintf (stdout, "Erreur : i=&d buffer[i]=M \n", 
i, buffer[i]); 



int 
main (void) 



int tube[2]; 
unsigned char buffer[256]; 
int i; 



fprintf (stdout, "Creation tube \n"); 
if (pipe(tube) != 0) { 

perror( "pipe" ) ; 

exi t( EXIT_FAI LURE) ; 



fprintf (stdout, "Lecture depuis tube \n"); 
if (read(tube[0], buffer, 256) != 256) { 

perrorC'read"); 

exit(EXIT_FAILURE); 
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exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Ok \n"); 
return EXIT_SUCCESS ; 

} 

Nous verifions son fonctionnement : 

$ ./exemple_pipe_l 

Creation tube 
Ecriture dans tube 
Lecture depuis tube 
Verification. . .Ok 
$ 

Utiliser un tube pour transferer des donnees au sein du meme processus ne presente aucun 
interet. Aussi nous allons utiliser ce mecanisme pour faire communiquer deux processus (ou 
plus). Pour cela, nous devons invoquer l'appel-systeme forkO apres avoir cree le tube. Si 
celui-ci doit aller du processus pere vers le fils, le pere ferme son descripteur de sortie de tube, 
et le fils son descripteur d' entree. Nous expliquerons plus bas pourquoi la fermeture des extre- 
mites inutilisees est importante. La figure 28.2 presente cet etat de fait. 




Notre second exemple permet de tester ceci. 
exemple_pipe_2.c : 

#include <stdio.h> 

//include <stdlib.h> 

#include <unistd.h> 

^include <sys/wait.h> 

int 
main (void) 
{ 

int tube[2]; 
unsigned char buffer[256]; 
int i ; 

fprintf (stdout, "Creation tube \n"); 
if (pipe(tube) != 0) { 

perror( "pipe" ) ; 

exit(EXIT_FAILURE); 

} 
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switch (forkO) { 
case -1 : 

perror( "fork( ) " ) ; 

exit(EXIT_ FAILURE); 
case 0 : 

fprintf (stdout, "Fils : Fermeture entree \n"); 
cl ose(tube[l] ) ; 

fprintf (stdout, "Fils : Lecture tube \n"); 
if (read(tube[0], buffer, 256) != 256) { 

perror( "read" ) ; 

exi t( EXIT_FAI LURE) ; 

} 

fprintf (stdout, "Fils : Verification \n"); 
for (i = 0; i < 256; i ++) 
if (buffer[i] != i) { 

fprintf (stdout, "Fils : Erreur \n"); 

exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Fils : Ok \n"); 
break; 
default : 

fprintf (stdout, "Pere : Fermeture sortie \n"); 

close(tube[0]) ; 

for (i = 0; i < 256; i ++) 

buffer[i ] = i ; 
fprintf (stdout, "Pere : Ecriture dans tube \n"); 
if (write(tube[l], buffer, 256) != 256) { 

perror( "write" ) ; 

exi t(EXIT_FAI LURE); 

} 

wait(NULL); 
break; 

} 

return EXIT_SUCCESS; 

} 

L' execution confirme bien le fonctionnement du tube allant du processus pere vers son fils. 

$ ./exemple_pipe_2 

Creation tube 

Pere : Fermeture sortie 

Fils : Fermeture entree 

Fils : Lecture tube 

Pere : Ecriture dans tube 

Fils : Verification 

Fils : Ok 

$ 

Nous remarquons que ce systeme est semblable au principe du pipe des shells, qui permet 
grace au caractere « | » de diriger la sortie standard d'un processus vers 1' entree standard 
d'un autre. Pour illustrer ce principe, nous allons creer un programme qui prend deux 
commandes en arguments et qui les execute en redirigeant la sortie standard de la premiere 
vers un tube connecte a F entree standard de la seconde. 
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Pour lancer les commandes nous utilisons f ork( ) pour dissocier deux processus, le fils execu- 
tant la premiere commande, et le pere la seconde. Pour eviter d' avoir a analyser les chaines de 
caracteres pour separer les commandes de leurs arguments, nous faisons appel a la fonction 
systemO. En fait, il aurait ete plus elegant d'employer execvpO, mais le traitement des 
chaines de commande aurait ete plus complique. 

Le principe de notre programme est illustre par la figure 28.3. 



Figure 28.3 

Creation d'un tube entre 
deux commandes 



exemple_pipe_3 



fork() 
system(). 



\system() 
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Nous utilisons l'appel-systeme dup2( ) que nous avons decrit dans le chapitre 19 pour rem- 
placer les flux stdin et stdout des processus par les extremites du tube. 

exemple_pipe_3.c : 

^include <stdio.h> 
#include <stdlib.h> 
^include <unistd.h> 



int 

main (int argc, char * argv[]) 
{ 

int tube[2]; 



if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s commande_l commande_2\n" . 
argv[0]) ; 

exit(EXIT_FAILURE); 

} 

if (pipe(tube) != 0) { 
perror( "pipe" ) ; 
exit(EXIT_FAILURE); 

} 

switch (forkO) { 
case -1 : 

perror( "fork( ) " ) ; 
exit(EXIT_FAILURE); 
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case 0 : 

close(tube[0]) ; 

dup2(tube[l], STD0UT_FI LENO ) ; 

system(argv[l] ) ; 

break; 
default : 

cl ose(tube[l] ) ; 

dup2(tube[0], STDIN_FI LENO) ; 

system(argv[2] ) ; 

break; 

} 

return EXIT_SUCCESS; 

} 

Pour verifier notre programme, nous allons lui faire executer l'equivalent de la commande 
shell Is -1 /dev | grep cdrom: 

$ ./exemple_pipe_3 "Is -1 /dev" "grep cdrom" 

lrwxrwxrwx 1 root root 3 Aug 12 17:57 cdrom -> hdc 

$ 

Nous voyons ainsi un mecanisme de plus employe par les interpreters de commande pour 
implementer toutes les fonctionnalites qu'ils offrent. Nous allons ameliorer encore notre 
programme en implementant une possibilite rarement proposee par les shells. Notre proces- 
sus va rediriger l'entree et la sortie standard d'un programme qu'il execute. Ceci permet 
d'utiliser une autre application comme une sous-routine du programme. Le principe est un 
peu semblable a celui de popen( ), mais cette fonction ne pouvait rediriger que l'entree ou la 
sortie du processus appele, alors que nous allons traiter les deux simultanement. Pour garder 
un exemple assez simple, nous invoquerons Futilitaire wc qui peut compter le nombre de 
caracteres, de mots ou de lignes dans un fichier de texte. Nous allons lui transmettre le 
contenu complet d'un fichier sur son entree standard et lire sa reponse sur sa sortie standard. 
La figure 28.4 illustre cet exemple. 



Figure 28.4 

Utilisation d'un processus 
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exemple_pipe_4.c 



#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <sys/stat.h> 
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int 

invoque_processus (const char * commande, int fd[2]) 
{ 

int tube_l[2]j 
int tube_2[2]j 

if ((pipe(tube_l) != 0) || (pipe(tube_2) != 0)) 

return -1; 
switch (forkO) { 

case -1 : 

close(tube_l[0]); cl ose(tube_l[l] ) ; 

close(tube_2[0]); cl ose(tube_2[l] ) ; 

return -1; 
case 0 : 

close(tube_l[l]) ; 

close(tube_2[0]); 

dup2(tube_l[0]. STD I N_FI LENO ) ; 

dup2(tube_2[l]. STD0L)T_FI LENO ) ; 

system(commande) ; 

exit(EXIT_SUCCESS); 
default : 

close(tube_l[0]); 

close(tube_2[l]) ; 

fd[0] = tube_2[0]; 

fd[l] = tube_l[l]; 

} 

return 0; 

} 

int 

main (int argc, char * argv[]) 
{ 

int tube[2]; 
FILE * fichier; 
char * contenu; 
char c; 

struct stat status; 

if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s fichier \n", argv[0]); 
exit(EXIT_FAILURE); 

} 

if (stat(argv[l] , & status) != 0) { 
perror( "stat" ) ; 
exit(EXIT_FAILURE); 

} 

if ((contenu = malloc(status.st_size)) == NULL) { 
perror("malloc"); 
exit(EXIT_FAILURE); 

} 

if ((fichier = fopen(argv[l] , "r")) == NULL) { 
perror( "fopen" ) ; 
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exit(EXIT_FAILURE); 

} 

if (f readtcontenu, 1, status. st_size, fichier) != 
status. st_size) { 

perror( "f read" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

fclose(fichier) ; 

if (invoque_processus("wc -w", tube) != 0) { 
perror("invoque_processus") ; 
exi t(EXIT_FAI LURE) ; 

} 

write(tube[l] . contenu, status. st_size) ; 
close(tube[l] ) ; 

fprintf (stdout, "Nombre de mots : "); 
while (read(tube[0], & c, 1) == 1) 

fputctc, stdout); 
close(tube[0]); 



if (invoque_processus("wc -1", tube) != 0) { 
perror("invoque_processus") ; 
exi t( EXIT_FAI LURE) ; 

} 

write(tube[l] , contenu, status. st_size) ; 
cl ose(tube[l] ) ; 

fprintf (stdout, "Nombre de lignes : "); 
while (read(tube[0], & c, 1) == 1) 

fputctc, stdout); 
close(tube[0]); 



free(contenu) ; 
return EXIT_SUCCESS; 

} 

Notre programme appelle successivement wc -w pour avoir le nombre de mots, et wc -1 pour 
le nombre de lignes. 

$ ./exemple_pipe_4 exemple_pipe_4.c 

Nombre de mots : 298 
Nombre de 1 ignes : 93 
$ 

On peut noter que nous avons pris soin, lorsque nous avons fini d'ecrire toutes nos donnees 
dans le tube, de fermer cette extremite. A ce moment, en effet, le noyau voit qu'il n'y a plus 
de processus disposant d'un descripteur sur F entree du tube puisque nous avions ferme egale- 
ment la copie de ce descripteur dans le processus fils. Des qu'un processus tentera de lire a 
nouveau dans le tube, comme le fait Futilitaire wc, le noyau lui enverra le symbole EOF, fin de 
fichier. II est done important de bien refermer 1' extremite du tube qu'on n' utilise pas imme- 
diate me nt apres avoir appele fork( ). 

Symetriquement, au moment d'une tentative d'ecriture dans un tube dont tous les des- 
cripteurs de sortie ont ete fermes, le processus appelant writeO recoit le signal SIGPIPE. 



746 



Programmation systeme en C sous Linux 



Par defaut ce signal tue le processus ecrivain, comme nous le voyons dans le programme sui- 
vant : 

exemple_pipe_5.c : 

#include <stdio.h> 
//include <stdlib.h> 
//include <unistd.h> 

int 
main (void) 
{ 

int tube[2]; 

char * buffer = "AZERTYUIOP" ; 

fprintf (stdout, "Creation tube \n"); 
if (pipe(tube) != 0) { 

perrorCpipe"); 

exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Fermeture sortie \n"); 
close(tube[0]); 

fprintf (stdout, "Ecriture dans tube \n"); 

if (write(tube[l] , buffer, strlen(buffer) ) != strlen(buffer) ) { 
perror( "write" ) ; 
exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Fin du programme \n"); 
return EXIT_SUCCESS ; 

} 

Nous observons que le programme est tue avant d' avoir pu ecrire son dernier message. 

$ ./exemple_pipe_5 

Creation tube 
Fermeture sortie 
Ecriture dans tube 
Broken pipe 
$ 

Le message « Broken pipe » provient du shell qui nous indique ainsi quel signal a tue notre 
processus. Si nous ignorons le signal SIGPIPE ou si nous le capturons, l'appel-systeme 
wri te( ) echoue avec l'erreur EPI PE. Le programme exempl e_pi pe_6 est une copie de exempl e_ 
pi pe_5 avec la ligne suivante ajoutee en debut de fonction mai n ( ) : 

signal (SIGPIPE, SIG_IGN); 

L execution montre alors que l'echec se produit a present dans l'appel writet ). 

$ . /exempl e_pipe_6 

Creation tube 

Fermeture sortie 

Ecriture dans tube 

write: Relais brise (pipe) 

$ 



Communications classiques entre processus 

Chapitre 28 



Nous avons constate dans nos premiers exemples qu'il est tout a fait possible d'ecrire dans un 
tube sans en lire immediatement le contenu - a condition qu'un descripteur de sa sortie reste 
ouvert. Cela signifie done que le noyau associe une memoire tampon a chaque tube. La 
dimension de cette memoire est representee par la constante symbolique PIPEJ3UF, definie 
dans le fichier <1 i mi ts . h>. Sur un PC sous Linux, cette constante vaut 4096. Nous pouvons le 
verifier en ecrivant dans un tube un caractere a la fois, en regardant au bout de combien 
d'octets l'ecriture devient bloquante. 

exemple_pipe_7.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 

int 
main (void) 

{ 

int tube[2]; 
char c = 'c' ; 
int i; 

fprintf (stdout, "Creation tube \n"); 
if (pipe(tube) != 0) { 

perror( "pipe" ) ; 

exi t( EXIT_FAI LURE) ; 

} 

fprintf (stdout, "Ecriture dans tube \n"); 
for (i =0; ; i ++) { 

fprintf (stdout, "%d octets ecrits \n", i); 
if (write(tube[l], & c, 1) != 1) { 
perror( "write" ) ; 
exi t(EXIT_ FAILURE); 

} 

} 

return EX IT_SUCCESS ; 

} 

Lorsque le buffer est plein, l'ecriture reste bloquee, et nous interrompons le processus en 
appuyant sur Controle-C : 

$ ./exemple_pipe_7 

0 octets ecrits 

1 octets ecrits 

2 octets ecrits 

[...] 

4092 octets ecrits 

4093 octets ecrits 

4094 octets ecrits 

4095 octets ecrits 

4096 octets ecrits 

(Controle-C) 

$ 
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En fait, la constante PI PE_BUF correspond egalement a la taille maximale d'un bloc de 
donnees qui puisse etre ecrit de maniere atomique. Lorsque plusieurs processus partagent un 
meme descripteur sur F entree du tube, leurs ecritures respectives ne seront pas entremelees si 
elles ne depassent pas PIPE_BUF octets a la fois. Le noyau garantit dans ce cas Fatomicite du 
transfert des donnees vers le buffer - quitte a bloquer l'ecriture avant le transfert s'il n'y a pas 
assez de place dans la zone tampon. 

On peut s'interroger sur les informations renvoyees lorsqu'on invoque l'appel-systeme 
stat( ) sur un descripteur de fichier. Nous pouvons en faire F experience. 

exemple_pipe_8.c : 

//include <stdio.h> 
//include <stdlib.h> 
//include <unistd.h> 
//include <sys/stat.h> 

int 
main (void) 
{ 

int tube [2]; 

struct stat status; 

fprintf (stdout, "Creation tube \n"); 
if (pipe(tube) != 0) { 

perrorCpipe"); 

exit(EXIT_FAILURE); 

} 

if (fstat(tube[0], & status) != 0) { 
perror( "f stat" ) ; 
exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Status : "); 
if (S_ISFIFO(status .st_mode)) 
fprintf(stdout, "FIF0\n"); 

el se 

fprintf(stdout, "? \n"); 
return EXIT_SUCCESS ; 

} 

Finalement le programme est un peu biaise car nous devinons deja ce que nous pouvons 
attendre. 

$ ./exemple_pipe_8 

Creation tube 
Status : FIFO 
$ 

Le type d'un descripteur de fichier appartenant a un tube est done « FIFO ». Les autres 
membres de la structure stat sont vides ou sans signification - hormis les champs st_uid et 
st_gid qui representent Fidentite du processus ayant cree le tube. 

Les tubes obtenus par l'appel-systeme pi pe( ) representent done un moyen de communication 
simple mais tres efficace entre des processus differents. Un probleme se pose pourtant, car il 
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faut necessairement que les interlocuteurs aient un ancetre commun, le processus qui a cree le 
tube 1 . II n'est pas possible de lancer des programmes independants - par exemple un serveur 
et des clients - et qu'ils etablissent un dialogue. 

Les tubes nommes 

Pour permettre ce genre de communications, le concept de tube a ete etendu pour disposer 
d'un nom dans le systeme de fichiers, donnant naissance au terme peu esthetique de « tube 
nomme » (named pipe). 

Un tube nomme est done simplement un nceud dans le systeme de fichiers. Lorsqu'on Fouvre 
pour la premiere fois, le noyau cree un tube de communication en memoire. Chaque ecriture 
et chaque lecture auront done lieu dans ce tube, avec les memes principes que ceux que nous 
avons etudies a la section precedente. 

Ce moyen de communication disposant d'une representation dans le systeme de fichiers, des 
processus independants peuvent F employer pour dialoguer, sans qu'ils soient obliges d'etre 
tous lances par la meme application. Les processus peuvent meme appartenir a des utilisa- 
teurs differents. 

Par ailleurs, il est frequent que plusieurs processus clients ecrivent dans le meme tube 
nomme, afin qu'un processus serveur lisent les requetes. Nous ecrirons un tel programme plus 
bas. Ceci est possible aussi avec des tubes simples, mais e'est de plus en plus rare car on 
prefere dans ce cas creer un canal de communication pour chaque client. 

Le nceud du systeme de fichiers representant un tube nomme est du type Fifo (first in first 
out), dont nous avons parle dans le chapitre 21. La creation d'un tel nceud peut se faire avec la 
fonction mkfifoO , declaree dans <sys/stat.h> : 

int mkfifo (const char * nom, mode_t mode); 

Cette fonction renvoie 0 si la creation a reussi et -1 en cas d'echec, par exemple si le nceud 
existait deja. Le mode indique en second argument est identique a celui qui est employe dans 
l'appel-systeme open( ). En fait, cette fonction de bibliotheque invoque directement l'appel- 
sy steme mknod( ) ainsi : 

int 

mkfifo (const char * nom, mode_t mode) 
{ 

dev_t dev = 0; 

return mknod(nom, mode | S_IFIF0, dev); 

} 

Le troisieme argument de mknod( ) est ignore quand le nceud n'est pas un fichier special de 
peripherique. 

On peut aussi employer l'utilitaire /usr/bi n/mkf i f o, qui sert de frontal a cette fonction, avec 
une option -m permettant d'indiquer le mode desire. Une fois le nceud cree, on peut l'ouvrir 
avec open( ) - avec les restrictions dues au mode d'acces -, ecrire dedans avec write( ), y lire 
avec readO, et le refermer avec closeO. La suppression d'un tube nomme se fait avec 
l'appel-systeme unlinkO. 



1 . Bien entendu tous les processus ont un ancetre commun, i n i t de PID 1 , et la plupart d' entre eux descendent du meme 
shell. Ce qui nous gene ici e'est que l'ancetre doit appartenir a la meme application. 
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Lorsqu'on ouvre un tube nomme en lecture seule, l'appel open( ) reste bloque jusqu'a ce que 
le tube soit ouvert en ecriture par un autre processus. Parallelement, une ouverture en ecriture 
seule est bloquante jusqu'a ce que le tube soit ouvert en ecriture par un autre processus. 

L' ouverture en lecture et ecriture n'est pas portable, car meme si la purpart des systemes 
l'acceptent, SUSv3 precise que ce comportement est indefini. Pour pouvoir ouvrir simultane- 
ment les deux extremites dans le meme processus, on emploie l'attribut 0_N0NBL0CK lors de 
l'appel-systeme openO afin de permettre une ouverture non bloquante. Dans ce cas, une 
ouverture en lecture seule n'attendra pas qu'un autre processus ouvre le tube en ecriture, et 
inversement. Nous nous trouvons alors dans la meme situation que lorsque le correspondant a 
ferme son extremite du tube. 

Une lecture depuis un tube non ouvert du cote ecriture renverra EOF, et une ecriture dans un 
tube dont la sortie est fermee declenchera SIGPIPE. II faut savoir que l'attribut 0_N0NBL0CK 
concerne aussi les lectures ou ecritures ulterieures. Les appels-systeme readO et writeO 
deviennent alors non bloquants, comme nous le verrons dans le 30. 

Une ouverture non bloquante, en lecture seule, renverra toujours 0, alors qu'une ouverture 
non bloquante en ecriture seule declenchera l'erreur ENXIO. 

II est theoriquement possible d'employer fopen( ) pour ouvrir une Fifo. Toutefois, je prefere 
utiliser systematiquement openO renvoyant un descripteur, suivi eventuellement d'un 
fdopen( ) me fournissant un flux a partir du descripteur obtenu, ceci pour plusieurs raisons : 

• Lors d'un fopenO, la bibliotheque C invoque openO, mais nous ne savons pas toujours 
avec quels arguments. Nous pouvons examiner les sources de la GlibC mais, en cas de 
portage sur un autre systeme, nous n'avons pas necessairement acces aux sources de la 
bibliotheque C. 

• La fonction fopen( ) ne permet pas, contrairement a open( ), de demander une ouverture 
non bloquante, ce qui est souvent indispensable, notamment lorsqu'on veut ouvrir les deux 
extremites d'un tube nomme dans le meme processus. 

• L'appel-systeme openO n'autorise pas la creation d'un fichier si l'attribut 0_CREAT n'est 
pas present. Au contraire, fopen( ) en mode « w » risque de creer un fichier normal si le 
nceud de la Fifo n'a pas encore ete cree par un autre processus. Non seulement les commu- 
nications ne fonctionneront pas, mais si nous detruisons le fichier en fin de programme 
avec unl i nk( ), nous avons peu de chances de nous rendre compte du probleme sans passer 
par une session de debogage assez penible. 

Dans le programme suivant nous allons utiliser plusieurs tubes nommes pour faire dialoguer 
un processus serveur avec plusieurs clients. Le serveur cree un nceud dans le systeme de 
fichier et y lit les requetes des clients. Ce tube dispose d'un nom connu par tous les processus. 
Pour repondre a la requete d'un client, le serveur doit pouvoir ecrire dans un autre tube 
nomme, specifique au client. Les requetes doivent avoir une taille inferieure a PIP E_BU F, afin 
d'etre sur qu'elles ne seront pas melangees dans le tube d' interrogation. Comme il faut bien 
donner un travail a faire au serveur vis-a-vis des clients, nous allons simplement lui faire 
renvoyer un anagramme de la chaine de caracteres transmise dans la requete. 

Le principe retenu pour faire fonctionner l'ensemble est le suivant : 

• Le serveur cree un nceud dans le systeme de fichiers, nomme anagramme. fifo. II ouvre 
ensuite ce tube en lecture et en ecriture, puis le rouvre sous forme de flux. 
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• Un client essaye d'ouvrir en ecriture seule le tube du serveur. S'il n'existe pas, le processus 
client se termine. Sinon, le client cree un tube personnel, nomme anagramme. <pid>, afin 
d'etre unique dans notre application. 

• Le client envoie au serveur une requete constitute du nom du tube pour la reponse, suivi 
d'un retour chariot et de la chaine de caracteres dont on desire un anagramme, suivie d'un 
retour chariot. Le serveur peut alors lire grace a f gets ( ) ces elements et repondre dans le 
tube du client. 

• Le client ouvre son tube en lecture seule, lit la reponse, l'affiche et se termine, apres avoir 
supprime avec unl i n k( ) son tube de reponse. 

• Si la chaine de caracteres recue vaut FIN, le serveur se termine egalement en supprimant le 
tube d' interrogation. 

Plusieurs clients peuvent travailler simultanement avec le serveur, car le noyau nous assure 
que toute requete dont la taille est inferieure a PIP E_BU F sera traitee de maniere atomique. Si 
le buffer ne dispose pas d'assez de place pour stocker les donnees, l'appel write( ) attendra 
qu'il se libere, mais la copie dans le buffer sera accomplie en une seule fois, sans qu'une autre 
ecriture ne puisse interferer. 

Nous avons ouvert, dans le serveur, le tube d' interrogation en lecture et ecriture. Ceci nous 
evite de rester bloque durant l'ouverture en attendant qu'un autre processus soit pret a ecrire, 
mais on y trouve aussi un second avantage. Si nous ouvrons le tube en lecture seule, a chaque 
fois que le client se termine, la lecture dans le serveur avec fgetsO echoue car le noyau 
envoie un EOF. En demandant un tube en lecture et ecriture, nous evitons cette situation, car il 
reste toujours au moins un descripteur ouvert sur la sortie. Nous supprimons ainsi un cas 
d'echec possible. 

Ce programme doit juste etre considere comme un exemple simpliste pour demontrer les 
possibilites des tubes nommes ; il lui manque un grand nombre de verifications des conditions 
d'erreur. 

exemple_serveur.c : 

#define _GNU_SOURCE /* Pour strfryO */ 

#include <fcntl .h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <sys/stat.h> 
#include <sys/types.h> 

static char * nom_noeud = "anagramme. fifo" ; 
static int 

repondre (const char * nom_fifo, char * chaine) 
{ 

FILE * reponse; 

int fd; 

char * anagramme; 
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if ((fd = open(nom_fifo. 0_WR0NLY)) >= 0) { 
reponse = fdopen(fd, "w"); 
anagramme = strdup(chaine) ; 
strfry(anagramme) ; 

fprintf(reponse, "£s\n", anagramme); 
fcl ose( reponse) ; 
f ree(anagramme) ; 

} 

if ( (strcasecmp(chaine, "FIN") == 0) 
| (strcasecmp(nom_fifo, "FIN") == 0)) 
return 1; 
return 0; 



int 
main (void) 
{ 

FILE * fichier; 
int fd; 

char nom_fifo[128] ; 
char chaine[128]; 

if (mkfifo(nom_noeud, 0644) != 0) { 

fprintf (stderr, "Impossible de creer le noeud Fifo \n"); 
exit(EXIT_FAILURE); 

} 

fd = open(nom_noeud, 0_RDWR); 
fichier = fdopentfd, "r"); 
while (1) { 

fgets(nom_fifo, 128, fichier); 

if (nom_fifo[strlen(nom_fifo) - 1] == '\n') 

nom_fifo[strlen(nom_fifo) - 1] = '\0'; 
fgets(chaine. 128, fichier); 
if (chaine[strlen(chaine) - 1] == '\n') 

chaine[strlen(chaine) - 1] = '\0'; 
if (repondre(nom_fifo, chaine) != 0) 
break; 

} 

unl ink(nom_noeud) ; 
return EXIT_SUCCESS; 

} 

Le processus client est construit ainsi : 
exemple_client.c : 

#incl ude <fcntl .h> 

#include <stdio.h> 

#1nclude <string.h> 

#include <unistd.h> 

#include <sys/stat.h> 

#include <sys/types.h> 
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int 
main (void) 

{ 

FILE * question; 
FILE * reponse; 
int fd; 

char nom_f i fo[128] ; 
char chaine[128]; 

fprintf (stdout, "Chaine a traiter : "); 
if (fgets (chaine, 128, stdin) == NULL) 
exit (0); 

sprintf (nom_fifo, "anagramme.^ld" , (long) getpidO); 
if (mkfifo(nom_fifo, 0644) != 0) { 

fprintf (stderr, "Impossible de creer le noeud Fifo \n"); 

exi t( EXIT_FAI LURE) ; 

} 

if ((fd = openC'anagramme.fifo", 0_WR0NLY) ) < 0) { 
fprintf (stderr, "Impossible d'ouvrir la Fifo \n"); 
exi t(EXIT_FAI LURE) ; 

} 

question = fdopentfd, "w"); 

fprintf (question, "%s\n%s", nom_fifo, chaine); 

fclose(question) ; 

fd = open(nom_fifo, 0_RD0NLY); 

reponse = fdopen(fd, "r"); 

if (fgetstchaine, 128, reponse) ! = NULL) 

fprintf (stdout, "Reponse = $s\n", chaine); 

else 

perror( "fgets" ) ; 
fclose(reponse) ; 
unl ink(nom_f i fo) ; 
return EXIT_SUCCESS; 

} 

L' execution suivante est resumee sur la figure 28.5. Le processus serveur est lance en arriere- 
plan, le shell nous indique quand il se termine avec la ligne Done exempl e_serveur. 

$ . /exempl e_serveur & 

[1] 1163 

$ Is -1 anagramme.fifo 

prw-r--r-- 1 ccb ccb 0 Jan 31 13:38 anagramme.fifo 

$ . /exempl e_client 

Chaine a traiter : Azertyuiop 

Reponse = trApezoiuy 

$ . /exempl e_client 
Chaine a traiter : Linux 
Reponse = uxinL 

$ . /exempl e_client 

Chaine a traiter : Anagramme 

Reponse = emAngmara 
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$ ./exemple_client 

Chaine a traiter : fin 

[1]+ Done ./exemple_serveur 

$ Is -1 anagramme.fi fo 

Is: anagramme.fifo: Aucun fichier ou repertoire de ce type 
$ 




On peut remarquer que le type Fifo est indique par le caractere p (pipe) dans l'affichage de la 
commande Is -1. Nous pouvons egalement ecrire directement dans le tube nomme 
anagramme.fi fo, a l'aide de la commande echo du shell et de son option -e qui lui permet 
d' interpreter le caractere \n. 

$ ./exemple_serveur & 

[1] 1170 

$ Is -1 anagramme.fifo 

prw-r--r— 1 ccb ccb 0 Jan 31 13:39 anagramme.fifo 

$ echo -e "FIN\nFIN" > anagramme.fifo 

[1]+ Done ./exemple_serveur 

$ Is -1 anagramme.fifo 

Is: anagramme.fifo: Aucun fichier ou repertoire de ce type 
$ 

J 'encourage vivement le lecteur a experimenter differents cas de figure dans les ouvertures 
des tubes nommes, afin de bien saisir les points de blocage et les moments ou f gets ( ) echoue 
car le correspondant a referme son extremite du tube. Pour bien suivre Fetat des differents 
processus concernes, on peut regarder regulierement le contenu du pseudo-repertoire /proc/ 
<pid>/fd/ , qui contient des liens symboliques decrivant les divers descripteurs employes par 
un programme. 
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Conclusion 

Nous avons observe ici une methode permettant de transferer des donnees d'un processus a 
un autre. Dans le cas du tube simple, on est limite a des descendants du processus de demar- 
rage de 1' application, mais le tube nomme permet d'etendre ce mecanisme en utilisant un 
nom dans le systeme de fichiers. 

En combinant les tubes et les signaux, on peut tres bien parvenir a une bonne communication 
entre les processus. Toutefois d'autres mecanismes sont egalement disponibles, comme nous 
le verrons dans le prochain chapitre. Nous nous interesserons aux possibilites de multiplexage 
d'entrees-sorties dans le chapitre 30, qui sont tres utiles dans les communications avec des 
tubes. 

Le principe de fonctionnement des tubes est important car il introduit un concept qu'on deve- 
loppera tres largement dans les chapitres 31 et 32 avec les communications reseau. 
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Ce qu'on nomme generalement IPC Systeme V recouvre trois mecanismes de communication 
entre processus {IPC, Inter Process Communication), apparus en 1983 dans la premiere 
version d'Unix Systeme V, mais qui n'ont ete que tardivement integres dans les standards 
comme Unix 98, et n'etaient pas definis par Posix. De nos jours elles sont finalement definies 
par SUSv3. 

Beaucoup de programmeurs rechignent a employer ces methodes de dialogue, car elles ne 
sont pas fondees sur le concept des descripteurs de fichiers, contrairement aux tubes, aux 
tubes nommes ou meme aux sockets. II n'est pas possible d'employer des schemas homo- 
genes pour traiter toutes les entrees-sorties d'un processus ni d'utiliser les methodes de multi- 
plexage et de traitements asynchrones que nous rencontrerons dans le prochain chapitre. 
Pourtant, il existe encore de nombreuses applications faisant usage de ces mecanismes, aussi 
allons-nous les etudier a present. 

On notera tout de suite que les IPC Systeme V peuvent etre autorises ou non lors de la compi- 
lation du noyau Linux. Ainsi, si les appels-systeme decrits dans ce chapitre echouent toujours 
avec l'erreur ENOSYS. II faudra done recompiler le noyau pour pouvoir les utiliser. 

Principes generaux des IPC Systeme V 

Les IPC regroupent, on l'a dit, trois methodes de communication : 

• Les files de messages, dans lesquelles un processus peut glisser des donnees ou en extraire. 
Les messages etant types, il est possible de les lire dans un ordre different de celui d' inser- 
tion, bien que par defaut la lecture se fasse suivant le principe d'une file d'attente. 

• Les segments de memoire partagee, qui sont accessibles simultanement par deux processus 
ou plus, avec eventuellement des restrictions telles que la lecture seule. 
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• Les semaphores, qui permettent de synchroniser Faeces a des ressources partagees. Nous 
avons deja rencontre les semaphores Posix.lb dans le chapitre 12, et il ne faut pas les 
confondre avec les semaphores des IPC Systeme V, meme si le principe reste globalement 
le meme. 

Dans tous les cas, ces outils de communication peuvent etre partages entre des processus n'ayant 
pas immediatement d'ancetre commun. Pour cela, les IPC introduisent le concept de cle. 

Obtention d'une cle 

Une ressource IPC partagee est accessible par l'intermediaire d'un nombre entier servant 
d'identificateur - numero de la file de messages ou de F ensemble de semaphores, identifiant 
du segment memoire -, qui est commun aux processus desirant Futiliser. 

Pour partager ce numero d' identification, un processus peut demander au systeme de creer la 
ressource de maniere privee, puis transmettre directement le numero - par l'intermediaire 
d'un fichier par exemple - aux autres processus avec lesquels il veut communiquer. Ce 
schema est souvent utilise si un processus ne desire communiquer qu'avec ses descendants, 
car il cree alors la ressource IPC privee avant d'invoquer fork( ). 

II est aussi possible de se servir, lors de la demande de creation de ressource, d'une cle qui 
permettra au systeme d' identifier FIPC desire. Cette cle peut etre commune a plusieurs 
processus, qui se mettent d' accord pour employer une valeur figee, un peu a la maniere des 
numeros de ports lors des connexions reseau. II faut alors documenter proprement F applica- 
tion pour bien indiquer les cles qu'elle utilise. 

Une derniere possibility, et finalement la meilleure, consiste a demander au systeme de creer 
lui-meme une cle, fondee sur des references communes pour tous les processus. La cle est 
constitute en employant un nom de fichier et un identificateur de projet. De cette maniere, 
tous les processus d'un ensemble donne pourront choisir de creer leur cle commune en utili- 
sant le chemin d'acces du fichier executable de l'application principale, ainsi qu'un numero 
de version par exemple. 

Une cle est fournie par le systeme sous forme d'un objet de type key_t, defini dans <sys/ 
type.hX La constante symbolique IPC PRIVATE, definie dans <sys/ipc.h> represente une cle 
privee, demandant sans condition la creation d'une nouvelle ressource IPC, comme dans le 
premier schema que nous avons imagine. 

Pour creer une nouvelle cle a partir d'un nom de fichier et d'un identificateur de projet, on 
emploie la fonction ftok( ) , declaree ainsi dans <sys/i pc . h> : 

| key_t ftok (char * nom_fichier, char projet); 

La cle creee emploie une partie du numero d'i-nceud du fichier indique, le numero mineur du 
peripherique sur lequel il se trouve et la valeur transmise en second argument pour faire une 
cle sur 32 bits : 



31. ..24 


23...16 


15.. .0 


Numero projet & OxFF 


Mineur peripherique & OxFF 


Numero i-nceud & OxFFFF 



La fonction ftok( ) ne garantit pas reellement Funicite de la cle, car plusieurs liens materiels 
sur le meme fichier renvoient le meme numero d'i-nceud. De plus, la restriction au numero 
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mineur de peripherique ainsi que l'utilisation seulement des 16 bits de poids faibles de 
l'i-nceud rendent possible - quoique tres improbable - l'existence de fichiers differents 
renvoyant la meme cle. 

Une fois qu'on a obtenu une cle ou qu'on a choisi d'utiliser une ressource privee avec IPC_ 
PRIVATE, on demande Faeces a 1'IPC proprement dite. 

Ouverture de I'IPC 

L'obtention de la ressource IPC se fait a l'aide de l'une des trois commandes msggetO, 
shmget( ) et semget( ). Les details d'appel seront precises plus bas, mais ces fonctions deman- 
dent au systeme de creer eventuellement la ressource si elle n'existe pas, puis de renvoyer un 
numero d' identification. Si la ressource existe deja et si le processus appelant n'a pas les auto- 
risations necessaires pour y acceder, les routines echouent en renvoyant -1 . 

A partir de l'identifiant ainsi obtenu, il sera possible respectivement : 

• d'envoyer et de recevoir des messages dans une file, a l'aide des fonctions msgsndO, et 
msggetO ; 

• d'attacher puis de detacher un segment de memoire partagee dans Fespace d'adressage du 
processus avec shmat( ) ou shmdt( ) ; 

• de lever de maniere bloquante ou non un semaphore, puis de le relacher avec la fonction 
commune semop( ). 



Attention 

II faut bien comprendre que I'emploi de IPC_PRIVATE dans msggetO, shmget( ) ou semget( ) n'empeche 
pas I'acces a la ressource par un autre processus, mais garantit uniquement qu'une nouvelle ressource sera 
creee. En effet, l'identifiant renvoye par la routine d'ouverture n'aura rien d'exceptionnel et un autre processus 
pourra tres bien I'employer - a condition bien sur d'avoir les autorisations d'acces necessaires. 



Controle et parametrage 

Les IPC proposent quelques options de parametrage specifiques au type de communication, 
ou generates. Pour cela, il existe trois fonctions, msgctl ( ), shmctl ( ) et semctl ( ), qui permet- 
tent de consulter des attributs regroupes dans des structures msqid_ds', shmid_ds et semid_ds. 

Dans tous les cas, ces structures permettent Faeces a un objet de type struct i pc_perm, defini 
ainsi dans <sys/ipc.h> : 



Norn 


Type 


Signification 


key 


key_t 


Cle associee a la ressource IPC 


seq 


unsigned short 


Numero de sequence, utilise de maniere interne par le systeme, a ne pas toucher 


mode 


unsigned short 


Autorisations d'acces a la ressource, comme pour les permissions des fichiers 


uid 


uid_t 


UID effectif de la ressource IPC 


gid 


gid_t 


GID effectif de la ressource IPC 



1. Attention il s'agit bien de msqid_ds - message queue identifier data structure - et non de msgidjs comme on pourrait 
s'y attendre. 
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Norn 


Type 


Signification 


cuid 


u 1 d_t 


UID du createur de la ressource 


cgid 


gid_t 


GID du createur de la ressource 



Ces informations permettent bien entendu de controler Faeces a la ressource IPC. Les modi- 
fications de mode ne peuvent etre realisees que par le proprietaire, le createur de la ressource 
ou par un processus ayant la capacite CAP_IPC_OWNER. 

Les fonctions de controle permettent egalement de detruire une ressource IPC. En effet, une 
file de messages, un ensemble de semaphores ou une zone de memoire partagee restent 
presents dans le noyau meme s'il n'y a plus de processus qui les utilisent. Ceci presente 
l'avantage d'une persistance des donnees entre deux lancements de la meme application - et 
peut par ailleurs etre utilise par des processus administratifs comme des demons - mais pose 
aussi F inconvenient d'une utilisation croissante de la memoire du noyau sans liberation auto- 
matique. II est done possible de demander explicitement la destruction d'une ressource IPC. 
Les processus en train de l'employer recevront une indication d'erreur lors de la tentative 
d'acces suivante. 

Files de messages 

Les files de messages sont des listes chainees gerees par le noyau pour contenir des donnees 
organisees sous forme d'un type suivi d'un bloc de message proprement dit. Cette representa- 
tion complique un peu la manipulation des messages, mais permet - grace au type transmis - 
de les hierarchiser par priorite ou d'obtenir un multiplexage en distinguant plusieurs processus 
destinataires differents lisant la meme file de messages. 

Le noyau gere un maximum de MSGMNI files independantes chacune pouvant comporter des 
messages de tailles inferieures a MSGMAX, soit 8 192 octets. Pour acceder a une file existante ou 
en creer une nouvelle, on appelle msgget( ), declaree ainsi dans <sys/msg . h> : 

int msgget (key_t key, int attribut); 

Cette routine renvoie l'identificateur de la file de messages demandee, ou -1 en cas d'erreur. 
Le premier argument doit comprendre une cle caracterisant la file desiree, construite en 
general a l'aide de la fonction ftok( ) que nous avons examinee plus haut. Si on veut etre sur 
de creer une nouvelle file qui ne sera pas utilisee en dehors du processus en cours et de ses 
descendants s'il appelle fork( ), on peut passer la valeur IPC_PRIVATE. 

Le second argument peut etre vu comme un equivalent grassier des deux derniers arguments 
de l'appel-systeme open( ). II s'agit d'une composition binaire des constantes suivantes : 

Nom Signification 

IPC_CREAT Creer une nouvelle file s'il n'y en a aucune presentement associee a la cle transmise en premier 
argument. 

IPC_EXCL Toujours creer une nouvelle file. La fonction msgget( ) echouera si une file existe deja avec la cle 
indiquee. 

Dans cet argument s'inserent egalement les permissions d'acces a la file creee, avec le meme 
format que le dernier argument de open ( ) . Seuls les 9 bits de poids faibles sont pris en compte 
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(pas de Set-UID, de Set-GID, ni de Sticky bit), et les autorisations d' execution n'ont pas de 
signification. 



Attention 

N'oubliez pas d'introduire ces autorisations d'acces lors de la creation, sinon la file aura les permissions 000, 
ce qui la rend pour le moins difficile a utiliser I 

On emploiera done les combinaisons suivantes : 

• Pour avoir une file uniquement reservee au processus appelant et a ses descendants : 
file = msgget ( IPC_PRIVATE, 0x600); 

Si le processus est installe Set-UID ou Set-GID et si lui ou ses descendants comptent changer 
d'identite ulterieurement, on modifiera le mode d'acces ou F appartenance en consequence. 

• Pour acceder a une file permettant de dialoguer avec d'autres processus du meme ensemble 
d' applications : 

I ma_cle = (key_t) N0MBRE_MAGIQUE ; 

file = msgget(ma_cle, IPC_CREAT | 0x660); 

Les autres processus utiliseront le meme nombre magique pour acceder a la file. II faudra 
se premunir contre les risques de conflits, en documentant le nombre employe et en lais- 
sant l'utilisateur le modifier, par exemple a Faide d'une option en ligne de commande. 

• Pour s'assurer de la creation d'une nouvelle file, cas d'un processus serveur ou d'un demon 
par exemple : 

ma_cle = ftok(argv[0] , 0); 

file = msgget(ma_cle, IPC_CREAT | IPC_EXCL | 0x622); 

Ici, on autorise tous les utilisateurs du systeme a nous envoyer des messages, mais seul le 
createur de la file peut les lire. La file est identifiee par une cle construite autour du nom de 
l'application principale. 

Symetriquement, un processus qui doit uniquement utiliser une file existante, si le pro- 
cessus serveur l'a deja creee, emploiera : 

ma_cle = ftok(fichier_executable_serveur, 0); 
file = msgget(ma_cle, 0); 

Naturellement, on verifie ensuite les cas d'erreur, en surveillant si le retour de msggetO est 
negatif et, si e'est le cas, en examinant errno : 



Valeur dans errno 


Signification 


EN0MEM 


Pas assez de memoire pour allouer les structures de controle dans le noyau. 


ENOSPC 


On veut creer une nouvelle file, mais la limite MSGMNI est atteinte. 


ENOENT 


La file demandee n'existe pas, et on n'a pas precise I'attribut I PC_CREAT. 


EEXIST 


La file existe et on a demande un acces exclusif avec I'attribut I PC_EXCL. 


EACCES 


La file existe, mais ses autorisations ne permettent pas d'y acceder. 


EIDRM 


La file existe, mais elle est en cours de suppression. 
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Une fois que la file est creee, on peut - sous reserve d' avoir les autorisations adequates - y 
ecrire des messages. Un message est une zone de memoire contigue contenant un entier 1 ong 
representant le type du message, suivi des donnees proprement dites. Le type du message, qui 
doit etre superieur a zero, est simplement une description interne a 1' application, qui n'a pas 
de signification pour le noyau. On Femploiera pour filtrer les messages a l'arrivee. 

La methode la plus simple est done de definir une structure regroupant le type du message et 
les donnees qu'on veut envoyer : 

typedef struct { 

/* Type pour msgsndO et msgrcvO */ 
long type; 

/* Donnees de 1 'appl ication */ 

char i denti f i ant[25] ; 

double x; 

double y; 

double Vitesse; 

time_t estimation_arrivee; 

} mon_message_t; 

La structure envoyee ne peut naturellement pas comprendre de pointeurs puisqu'ils n'auraient 
aucune signification dans l'espace d'adressage du processus recepteur. La transmission d'une 
chaine de caracteres doit autant que possible se faire en employant une zone allouee automa- 
tiquement dans la structure, comme le champ i denti fi ant de notre exemple ci-dessus. La 
transmission de donnees allouees dynamiquement est assez compliquee puisqu'elle necessite 
la reservation d'un espace de la dimension d'un 1 ong i nt avant la zone veritablement utilisee. 

L'envoi d'un message se fait par 1' intermediate de l'appel-systeme msgsnd( ) , declare ainsi : 

i nt msgsnd (int file, const void * message, int taille, i nt attn'buts); 

Le numero de file indique doit avoir ete fourni prealablement par msgget( ), le second argu- 
ment pointe sur le message tel que nous venons de le decrire, et le troisieme argument indique 
la longueur utile du message sans compter son type. En derniere position, le seul attribut 
qu'on puisse transmettre eventuellement est IPC_NOWAIT, pour que l'appel-systeme ne soit pas 
bloquant. Sinon, s'il n'y a pas assez de place dans la file pour stocker le message, msgsnd( ) 
reste en attente. 

La valeur de retour de msgsnd ( ) est zero si tout s'est bien passe, et -1 sinon. Dans ce cas errno 
peut contenir Fun des codes suivants : 



Valeur dans errno 


Signification 


EACCES 


Le processus doit avoir I'autorisation d'ecrire dans la file, et ce n'est pas le cas. 


EAGAIN 


On a demande une emission non bloquante avec I PC_N0WAIT, et il n'y a pas assez de place 
dans la file pour le moment. 


EIDRM 


La file a ete supprimee. 


EINTR 


Un signal a interrompu l'appel-systeme avant qu'il n'ait pu ecrire quoi que ce soit. 


E FAULT, EINVAL 


Argument de msgsnd ( ) ou type de message invalide. 


ENOMEM 


Manque de memoire dans le noyau pour stocker le message. 
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Le message est copie dans la file, aussi il est possible d'ecraser les donnees originales des le 
retour de msgsnd( ). 

La lecture dans une file de messages se fait en invoquant l'appel-systeme msgrcvO, declare 
ainsi : 

int msgrcv (int file, void * message, int taille, 
long type, int attributs); 

Les premiers arguments ont la meme signification que dans msgsnd( ), le troisieme indiquant 
la taille maximale de la zone de donnees du message a lire, qui doit done etre disponible en 
seconde position. On emploie generalement MSGMAX, qui correspond a la taille maximale d'un 
message sur le systeme, ou une dimension fixee si tous les messages sont constitues autour de 
la meme structure. 



Attention 

La taille ne prend pas en compte le type du message, il s'agit uniquement de la zone utile du message. 



Le type indique en quatrieme position permet de selectionner les messages qu'on desire rece- 
voir. Le comportement de msgrcv( ) varie en fonction de cette valeur : 

• Un type nul indique qu'on veut recevoir le prochain message disponible dans la file. C'est le 
comportement habituel d'une file de messages, oil on traite les donnees dans l'ordre d'arrivee. 

• Un type positif permet de reclamer le premier message dudit type disponible dans la file. 
Cette methode donne la possibilite de multiplexer plusieurs processus en ecriture et 
plusieurs en lecture sur la meme file. Chacun d'eux utilise un identifiant unique - par 
exemple son PID -, et la file permet a n'importe quel processus d'envoyer un message vers 
un destinataire precis. 

• Un type negatif sert a reclamer le premier message disponible ayant le plus petit type infe- 
rieur ou egal a la valeur absolue de ce quatrieme argument. II est ainsi possible d'introduire 
des priorites entre les messages. Le message avec le plus faible type (1) sera delivre avant 
tous les autres, meme s'ils sont en attente depuis plus longtemps. 

Le dernier argument peut contenir un OU binaire avec les constantes suivantes : 





Norn 


Signification 


IPC 


_N0WAIT 


Ne pas rester en attente si aucun message du type reclame n'est disponible, mais au contraire 
echouer avec I'erreur ENOMSG. 


MSG 


.EXCEPT 


Reclame un message de n'importe quel type sauf celui qui est indique en quatrieme argument, qui 
doit etre necessairement strictement positif. 


MSG 


JOERROR 


Si le message extrait est trap long, il sera tronque sans que I'erreur E2BIG se produise, 
contrairement au comportement par defaut. 



Lorsqu'elle reussit cette fonction renvoie le nombre d'octets du message - non compris son 
type - et -1 lorsqu'elle echoue. Dans ce cas, errno peut contenir les codes EFAULT, EIDRM, 
EINTR ou EINVAL, avec les memes significations que pour msgsnd( ), ou : 

• EACCES : le processus n'a pas la permission de lecture sur la file. 

• ENOMSG : aucun message disponible lors d'une lecture avec l'attribut IPC_NOWAIT. 
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• E2BIG : le message disponible est trop grand pour tenir dans la zone transmise. 

Finalement, le controle et le parametrage d'une file de messages se font a l'aide de la fonction 
msgctl ( ). Celle-ci est declaree ainsi : 

int msgctl (int file, int commande, struct msqid_ds * attributs) ; 

II y a trois commandes possibles, qu'on passe en second argument : 

• I PC_STAT : pour obtenir les parametres concernant la file de messages et les stocker dans la 
structure msqid_ds passee en derniere position. Cette structure sera detaillee plus bas. II 
faut avoir l'autorisation de lecture sur la file de messages. 

• I PC_SET : pour configurer certains parametres en utilisant la structure passee en troisieme 
argument. Les parametres qui sont mis a jour seront decrits ci-dessous. Pour pouvoir modi- 
fier ces elements, il faut que le processus appelant soit le proprietaire ou le createur de la 
file de messages, ou qu'il ait la capacite CAP_SYS_ADMIN. 

• IPC_RMID : pour supprimer la file de messages. Tous les processus en attente de lecture ou 
d'ecriture sur la file seront reveilles. Les operations ulterieures d'acces a cette file echoue- 
ront. II y a toutefois un risque qu'une nouvelle file soit creee par la suite et que le noyau lui 
attribue le meme identifiant. Si un processus attend longtemps avant d'acceder a la file 
supprimee, il risque de se trouver en face de la nouvelle file sans s'y attendre. Ce manque 
de fiabilite est l'un des arguments employes par les detracteurs des IPC Systeme V. 

La structure msqid_ds est definie dans <sys/msg.h>. Ses membres susceptibles de nous inte- 
resser sont : 



Norn 


Type 


Signification 


msg_perm 


struct ipc_perm 


Autorisations d'acces a la file de messages 


msg_stime 


time_t 


Heure du dernier msgsndt ) sur la file 


msg_rtime 


time_t 


Heure du dernier msgrcvt ) sur la file 


msg_ctime 


time_t 


Heure du dernier parametrage de la file 


msg_qnum 


unsigned short 


Nombre de messages actuellement presents dans la file 


msg_qbytes 


unsigned short 


Taille maximale en octets du contenu de la file 


msg_l spid 


Pid_t 


PID du processus ayant effectue le dernier msgsnd( ) 


msg_l rpid 


Pid_t 


PID du processus ayant effectue le dernier msgrcv( ) 



Rappelons que le detail de la structure ipc_perm composant le premier membre a ete deve- 
loppe dans la section precedente. II existe d'autres champs dans la structure msqi d_ds, mais ils 
sont plutot reserves a F usage interne du noyau. 

Lorsqu'on utilise la commande IPC_SET, les membres suivants sont mis a jour : msg_pe rm . uid, 
msg_perm.gid, msg_perm.mode et msg_qbytes. Si toutefois cette derniere valeurest superieure a 
la constante MSGMNB (16 Ko par defaut), le processus doit necessairement avoir la capacite CAP_ 
SYS_RESOURCE. 

Nous allons construire trois petits programmes servant d' interface en ligne de commande 
pour msgsnd( ), msgrcv( ) et msgctl ( ) avec la commande IPC_RMID. Le premier prend en argu- 
ments le nom d'un fichier servant pour creer la cle IPC, une valeur indiquant le type du 
message, et une chaine de caracteres composant le corps du message emis. 
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exemple_msgsnd.c : 

#include <stdio.h> 

#include <string.h> 

#include <sys/types.h> 

#include <sys/ipc.h> 

#include <sys/msg.h> 

typedef struct { 

long type; 

char texte [256]; 
} message_t; 

int 

main (int argc, char * argv []) 

{ 

key_t key ; 
message_t message; 
int file; 

if (argc != 4) { 

fprintf (stderr, "Syntaxe : %s fichier_cle type message \n", 
argv[0]) : 

exi t( EXIT_FAI LURE) ; 

} 

if ((key = ftok(argv[l] , 0)) == -1) { 
perror( "ftok" ) ; 
exi t(EXIT_FAI LURE); 

} 

if ((sscanf(argv [2], "£ld", & (message. type)) != 1) 
| | (message. type <= 0) ) { 

fprintf (stderr, "Type invalide"); 
exi t(EXIT_FAI LURE) ; 

} 

strncpy (message. texte, argv[3], 255); 
message. texte[255] = '\0'; 

if ((file = msggettkey, IPC_CREAT | 0600)) == -1) { 
perror( "msgget" ) ; 
exi t(EXIT_FAI LURE); 

} 

if (msgsnd(file, (void *) & message, 256, 0) <0) { 
perror( "msgsnd" ) ; 
exit(EXIT_FAILURE); 

} 

return EXIT_SUCCESS; 

} 

Le second programme permet de bloquer en attente d'un message. Ses arguments sont le nom 
du fichier servant de cle et le type du message attendu. 

exemple_msgrcv.c : 

#include <stdio.h> 
#include <string.h> 
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//include <sys/types.h> 
//include <sys/ipc.h> 
//include <sys/msg.h> 

typedef struct { 

long type; 

char texte [256]; 
} message_t; 

int 

main (int argc, char * argv[]) 
{ 

key_t key ; 
message_t message; 
int file; 
long type; 

if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s fichier_cle type \n", argv[0]); 
exit(EXIT_FAILURE); 

if ((key = ftok(argv[l] , 0)) == -1) { 
perror( "ftok" ) ; 
exit(EXIT_FAILURE); 

if (sscanf(argv[2], "Sid", & type) ! = 1) { 
fprintf (stderr, "Type invalide"); 
exit(EXIT_FAILURE); 

if ((file = msgget(key, IPC_CREAT | 0600)) == -1) { 
perror( "msgget" ) ; 
exit(EXIT_FAILURE); 

if (msgrcv(file, (void *) & message, 256, type, 0) >= 0) 

fprintf (stdout, "(%ld) %s \n", message. type, message. texte) ; 

el se 

perror( "msgrcv" ) ; 
return EXIT_SUCCESS; 

} 

Finalement notre troisieme programme servira uniquement a detruire une file, en prenant en 
argument le nom du fichier servant de cle. 

exemple_msgctl.c : 

//include <stdio.h> 
//include <string.h> 
//include <sys/types.h> 
//include <sys/ipc.h> 
//include <sys/msg.h> 

int 

main (int argc, char * argv[]) 
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I 

key_t key; 
int file; 

if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s fichier_cle \n", argv[0]); 
exit(EXIT_FAILURE); 



Voyons a present Futilisation de ces commandes. Tout d'abord, nous allons simplement 
envoyer quelques messages et les recuperer dans l'ordre d'emission. Nous utilisons le fichier 
executable exempl e_msgsnd pour creer la cle d'acces a la file : 

$ . /exempl e_msgsnd . /exempl e_msgsnd 1 "Message 1" 

$ . /exempl e_msgsnd . /exempl e_msgsnd 2 "Message 2" 

$ . /exempl e_msgsnd . /exempl e_msgsnd 1 "Message 3" 

$ . /exempl e_msgrcv . /exempl e_msgsnd 0 

(1) Message 1 

$ . /exempl e_msgrcv . /exempl e_msgsnd 0 

(2) Message 2 

$ . /exempl e_msgrcv . /exempl e_msgsnd 0 

(1) Message 3 
$ 

Avec un argument type nul lors de la lecture, les messages sont simplement extraits dans 
l'ordre d'arrivee, sans tenir compte de leur type reel. A present, nous allons utiliser un type 
positif lors de la lecture, afin de verifier qu'on peut ainsi filtrer le destinataire. La lecture etant 
bloquante, nous l'interrompons par un Controle-C lorsqu'il n'y aura plus de messages dispo- 
nibles. 

$ . /exempl e_msgsnd . /exempl e_msgsnd 1 "ler message pour 1" 

$ . /exempl e_msgsnd . /exempl e_msgsnd 1 "2eme message pour 1" 

$ . /exempl e_msgsnd . /exempl e_msgsnd 2 "ler message pour 2" 

$ . /exempl e_msgsnd . /exempl e_msgsnd 2 "2eme message pour 2" 

$ . /exempl e_msgsnd . /exempl e_msgsnd 2 "3eme message pour 2" 

$ . /exempl e_msgrcv . /exempl e_msgsnd 1 
(1) ler message pour 1 

$ . /exempl e_msgrcv . /exempl e_msgsnd 1 

(1) 2eme message pour 1 

$ . /exempl e_msgrcv . /exempl e_msgsnd 1 

(Controle-C) 

$ . /exempl e_msgrcv . /exempl e_msgsnd 2 

(2) ler message pour 2 



if ((key = ftok(argv[l] , 0)) 
perrorC'ftok"); 
exit(EXIT_ FAILURE); 



-1) f 



if ((file = msgget(key, 0)) 

exit(EXIT_SUCCESS); 
msgctKfile, IPC_RMID, NULL) 



-1) 



return EXIT_SUCCESS; 
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$ ./exemple_msgrcv ./exemple_msgsnd 2 
(2) 2eme message pour 2 
$ ./exemple_msgrcv ./exemple_msgsnd 2 
(2) 3eme message pour 2 
$ ./exemple_msgrcv ./exemple_msgsnd 2 
(Controle-C) 

$ 

Nous voyons bien qu'une lecture reclamant un type 1 restera bloquee s'il n'y a pas de 
message de ce type disponible, meme s'il y en a de type 2. II est possible ainsi d'implementer 
un serveur lisant des requetes provenant de multiples clients et leur repondant dans la meme 
file de messages. Chaque client insere son propre PID dans le message requete et l'envoie 
avec le type 1. Le serveur lit les messages de type 1 et y repond en leur attribuant comme 
type le PID du client concerne. Chacun peut ainsi filtrer les messages qui le concernent. Natu- 
rellement, le PID numero 1 etant reserve au processus init, il n'y a pas d'ambiguite lors des 
interrogations. 

Maintenant nous allons illustrer la possibilite de gerer des priorites en transmettant un argu- 
ment type negatif lors de la lecture. 

$ ./exemple_msgsnd . /exempl e_msgsnd 3 "ler Message" 
$ . /exempl e_msgsnd ./exemple_msgsnd 2 "2eme Message" 
$ ./exemple_msgsnd ./exemple_msgsnd 5 "3eme Message" 
$ ./exemple_msgsnd ./exemple_msgsnd 2 "4eme Message" 
$ ./exemple_msgsnd ./exemple_msgsnd 1 "5eme Message" 
$ ./exemple_msgrcv ./exemple_msgsnd -4 

(1) 5eme Message 
$ ./exemple_msgrcv ./exemple_msgsnd -4 
(2) 2eme Message 

$ ./exemple_msgrcv ./exemple_msgsnd -4 

(2) 4eme Message 

$ ./exemple_msgrcv ./exemple_msgsnd -4 

(3) ler Message 

$ ./exemple_msgrcv . /exempl e_msgsnd -4 

(Controle-C) 
$ ./exemple_msgrcv ./exemple_msgsnd -5 

(5) 3eme Message 
$ 

Nous voyons que les messages sont bien extraits dans l'ordre des priorites croissantes ou dans 
l'ordre d'arrivee en cas d'egalite (type 2 dans notre exemple). On remarque qu'en reclamant 
un type inferieur ou egal a 4 lors de la lecture, on n'obtient jamais les messages de priorite 
superieure (5 en l'occurrence). 

Enfin, nous allons examiner ce qui se passe lors de la suppression d'une file alors qu'un 
processus est en attente de lecture. On utilise un second terminal represente ici en deuxieme 
colonne pour invoquer exempl ejsgctl . 

$ . /exempl e_msgrcv exempl e_msgsnd 0 

$ . /exempl e_msgctl exempl e_msgsnd 

msgrcv: Identificateur elimine $ 
$ 

Le message affiche par perror( ) correspond a l'erreur EIDRM. 
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Etant donne que les files d'attente, comme les autres ressources IPC par ailleurs, sont persis- 
tantes jusqu'a leur suppression par msgctl ( ) ou par l'arret du systeme, il existe deux utili- 
taires d' administration, /usr/bin/ipcs et /usr/bin/ipcrm, permettant de les manipuler. La 
premiere commande affiche la liste de toutes les ressources IPC en cours d' utilisation sur le 
systeme, avec des informations sur le proprietaire, l'espace occupe, etc. Le second utilitaire 
permet de supprimer une ressource - a condition d'en avoir le droit - en indiquant le type de 
ressource et son identifiant, fourni par ipcs. En voici un exemple : 

$ ./exemple_msgsnd exemple_msgsnd 1 "Message" 
$ ipcs 

Shared Memory Segments 

key shmid owner perms bytes nattch status 
Semaphore Arrays 

key semid owner perms nsems status 
Message Queues 

key msqid owner perms used-bytes messages 

0x0005e931 1280 ccb 600 256 1 

$ ipcrm 

usage: ipcrm [shm | msg | sem] id 
$ ipcrm msg 1280 
resource deleted 
$ ipcs 

Shared Memory Segments 

key shmid owner perms bytes nattch status 
Semaphore Arrays 

key semid owner perms nsems status 
Message Queues 

key msqid owner perms used-bytes messages 



$ 

On peut se demander comment l'utilitaire ipcs arrive a obtenir la liste des IPC presentes. 

Cette commande balaye en fait les identifiants compris entre 0 et le nombre maximal de files 
autorisees sur le systeme, et invoque msgctl ( ) avec la commande MSG_STAT sur chacun d'eux. 
Cette commande echoue si l'identifiant n'est pas utilise. 

Pour obtenir des informations globales, telles que le nombre maximal de messages par file, 
l'utilitaire s'appuie sur une structure d'information particuliere nommee msginfo, qu'on 
emploie a la place de la structure msqid_ds dans l'appel msgctl ( ), avec une conversion expli- 
cite de type. La commande utilisee est alors MSG_INF0, qui demande au noyau de remplir la 
structure msginfo. Celle-ci contient des donnees diverses sur les limites imposees aux files de 
messages, ainsi que sur l'etat actuel de leur utilisation. II existe des equivalents de cette struc- 
ture d'information pour les autres ressources IPC. Ce mecanisme est propre a Linux. 

Le fait que les files de messages continuent a occuper de la memoire dans le noyau tant 
qu'elles n'ont pas ete explicitement detruites est un inconvenient important. Un autre gros 
defaut de ce moyen de communication est l'impossibilite de faire dialoguer des applications 
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se trouvant sur des machines differentes. Nous verrons que la solution BSD au probleme de 
communication entre processus (le systeme des sockets) est nettement plus avantageuse car 
elle permet de maniere transparente de faire dialoguer des processus repartis sur differents 
systemes. II existe toutefois un domaine ou les IPC Systeme V sont encore largement 
employes : le partage de segment de memoire. 

Memoire partagee 

Nous avons deja observe dans le chapitre 14 une methode permettant de partager une zone de 
memoire entre deux processus distincts, en employant mmap( ) avec l'attribut MAP_SHARED pour 
projeter un fichier de la dimension voulue. L' inconvenient de cette technique est d'une part 
que la memoire n'est partagee qu' entre processus issus d'un meme pere. L'appel mmap( ) doit 
etre realise avant la separation des processus par forkO. D'autre part, cette projection en 
memoire n'etant pas conservee lors d'un exec( ), il n'est pas possible de partager des donnees 
entre des programmes executables differents. 

Rappelons egalement que la solution extreme au partage de memoire entre portions de code 
differentes - les threads - n'est pas non plus applicable pour executer des programmes 
distincts. 

En fait, le systeme de la memoire partagee offert par les IPC Systeme V est assez elegant : 

• Une fonction shmget( ) permet a partir d'une cle key_t d'obtenir l'identifiant d'un segment 
de memoire partagee existant ou d'en creer un au besoin. 

• L'appel-systeme shmatO permet d'attacher le segment dans l'espace d'adressage du 
processus. 

• La fonction shmdt( ) sert a detacher le segment si on ne l'utilise plus. 

• Enfin, l'appel-systeme shmctl ( ) permet de parameter ou de supprimer un segment partage. 
Les prototypes de ces routines sont declares dans <sys/shm. h> ainsi : 

int shmget (key_t key, int taille, int attributs); 
char * shmat (int i denti f i ant , char * adresse, int attributs); 
int shmdt (char * adresse); 
int shmctl (int i denti fi ant, int commande, 
struct shmid_ds * attributs); 

L'appel-systeme shmgetO fonctionne globalement comme msggetO, en employant la cle 
transmise en premier argument pour rechercher ou creer un bloc de memoire partagee. Les 
attributs indiques en derniere position comportent les 9 bits de poids faibles de l'autorisation 
d'acces, et eventuellement les constantes IPC_CREAT et IPCLEXCL qui ont les memes significa- 
tions qu'avec les files de messages. Les erreurs renvoyees par cette fonction sont equivalentes 
a celles de msgget( ). 

Le second argument de cette routine est la taille du segment desire, en octets. Cette taille sert 
lors de la creation d'une nouvelle zone de memoire partagee. La valeur indiquee est arrondie 
au multiple superieur de la taille des pages memoire sur le systeme (4 Ko sur un PC). Si la 
taille demandee lors de la creation est inferieure a la valeur SHMMIN ou superieure a SHMMAX, 
une erreur se produit. Pour acceder a une zone memoire deja existante, il faut demander une 
valeur inferieure ou egale a la taille effective du segment. On emploie generalement zero dans 
ce cas, car le systeme ne reduit pas la taille de la projection d'un segment existant. 
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Une fois obtenu l'identifiant d'un segment partage, on doit l'attacher dans l'espace memoire 
du processus a l'aide de la fonction shmatO. On indique en second argument l'adresse 
desiree pour l'attachement. Si cette adresse est nulle, le noyau recherche un emplacement 
libre dans l'espace d'adressage du processus, y realise la projection, et l'appel-systeme 
shmatO renvoie l'adresse du premier octet de la zone partagee. C'est bien entendu le 
mecanisme qu'on utilisera toujours. Le fait de mentionner explicitement une adresse d'atta- 
chement ne se justifie que dans des cas exceptionnels (par exemple des emulateurs ou des 
debogueurs) ne nous concernant pas ici. Mentionnons quand meme que l'adresse transmise 
dans ce cas doit etre alignee sur une frontiere de page, ou alors il faut passer l'attribut SHM_RND 
dans le dernier argument pour demander au noyau d'arrondir l'adresse indiquee a la limite de 
page inferieure. 

L'attachement peut etre realise en lecture seule si l'attribut SHM_RDONLY est passe en troisieme 
argument de shmat( ), sinon la projection est realisee en lecture et ecriture. 

La fonction shmctl ( ) permet, a la maniere de msgctl ( ) , d'agir sur un segment partage. La 
commande employee en seconde position peut etre : 

• IPC_STAT : pour remplir la structure shmicLds que nous allons detailler ci-dessous. 

• I PC SET : pour modifier F appartenance ou les autorisations d'acces au segment. 

• I PC RMI D : pour supprimer le segment. Ce dernier est alors marque comme « pret pour la 
suppression », mais ne sera effectivement detruit qu'une fois qu'il aura ete detache par 
le dernier processus qui l'utilise. Cela signifie aussi que tant qu'un processus conserve le 
segment attache, il est toujours possible de le lier a nouveau avec shmat( ), meme s'il a ete 
marque pour la destruction. 

• SHM_L0CK : permet de verrouiller le segment en memoire pour s'assurer qu'il ne sera pas 
envoye sur le peripherique de swap. Nous avons deja etudie ce mecanisme dans le chapitre 
14 avec l'appel-systeme mlockO. Cette operation reduisant la memoire vive disponible 
pour les autres processus, elle est privilegiee et necessite un UID nul ou la capacite CAP_ 
IPC_L0CK. 

• SHM_UNLOCK : permet symetriquement de deverrouiller une page de la memoire, autorisant 
a nouveau son transfert en memoire secondaire. 

La structure shmicLds contenant les parametres associes au segment de memoire partagee 
comprend notamment les membres suivants : 
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Type 


Signification 




shm_perm 


struct ipc_perm 


Autorisation d'acces au segment de memoire 




shm_segsz 


size_t 


Taille en octets du segment 




shm_atime 


time_t 


Heure du dernier attachement 




shm_dtime 


time_t 


Heure du dernier detachement 




shm_ctime 


time_t 


Heure de la derniere modification des autorisations 




shm_cpid 


pi d_t 


PID du processus createur du segment 




shm_lpid 


pi d_t 


PID du processus ayant realise la derniere intervention 




shm_nattch 


unsigned short 


Nombre actuel d'attachements en memoire 
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On remarquera que l'utilisation des segments de memoire partagee est le mecanisme de 
communication entre processus le plus rapide, car il n'y a pas de copie des donnees trans- 
mises. On evite notamment le transfert des informations entre Fespace memoire de Futilisa- 
teur et Fespace memoire du noyau, a la difference de msgsnd( ) sur les files de messages, ou 
meme de wri te( ) lors de l'utilisation de sockets BSD. Ce procede de communication est done 
parfaitement adapte au partage de gros volumes de donnees entre processus distincts. 

Nous avons signale que la taille demandee lors de la creation d'un segment est arrondie au 
multiple superieur de la dimension d'une page. Cette dimension represente 4 Ko sur un PC, 
ce qui n'est pas negligeable. Ceci implique qu'il faut eviter de creer trop de petits segments 
partages, pour eviter de gacher des ressources memoire. Si on veut partager simultanement de 
multiples variables, on les regroupera au sein d'un tableau ou d'une structure pour les reunir 
sur une meme page memoire. 

Comme nous 1' avons vu lors de notre etude des threads dans le chapitre 12, il est indispen- 
sable, lors de Faeces a des ressources communes, de synchroniser les differents acteurs, pour 
eviter les interferences regrettables. Pour cela, on dispose d'un dernier mecanisme IPC 
servant a organiser l'utilisation des memoires partagees : les semaphores. 

Nous attendrons done la fin de la prochaine section pour presenter un exemple d'utilisation 
des appels-systeme examines precedemment. 

Semaphores 

Nous avons deja rencontre, dans le chapitre 12, les semaphores temps-reel, permettant la 
synchronisation de differents threads. Le principe reste quasiment le meme ici, mais les fonc- 
tions sont totalement differentes. 

Un semaphore est dans sa forme la plus simple un drapeau qui peut etre leve ou baisse. II sert 
a controler Faeces a une ressource critique grace a deux operations : 

• Avant Faeces, un processus attend que le drapeau soit leve, puis il le baisse. 

• Apres avoir utilise la ressource protegee, le processus releve le drapeau, et le noyau 
reveille les autres processus bloques dans l'operation precedente. 

Le test qui intervient dans la premiere de ces operations est atomiquement lie a la modifica- 
tion qui le suit. Ceci garantit qu'en aucun cas deux processus ne verront simultanement le 
drapeau baisse et se Fattribueront. 

Ces deux operations sont generalement notees P() et V() en abreviation des traductions des 
termes tester et incrementer en hollandais, langue natale de Finventeur des semaphores, 
Edsger Dijkstra. Dans F implementation Systeme V des semaphores, elles sont toutefois 
quelque peu compliquees : 

Un semaphore peut servir a controler non plus une simple ressource critique mais un acces a 
plusieurs exemplaires de la meme ressource. Ainsi le drapeau est remplace par un compteur, 
qu'on augmente ou diminue d'une valeur entiere qui n'est pas necessairement 1. L'operation 
Pn() est alors bloquante tant que le compteur du semaphore est inferieur a la valeur n 
demandee, puis elle diminue le compteur de cette quantite. Parallelement, l'operation Vn() 
doit incrementer le compteur de la valeur n d'exemplaires liberes de la ressource. 

Meme lorsque chaque operation P() ou V() est invoquee avec n = 1, l'utilisation d'un comp- 
teur associe au semaphore est interessante, puisque ce mecanisme permet d'autoriser Faeces 
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simultane d'un nombre limite de processus a une quantite donnee de ressources. Par exemple, 
on peut limiter la consommation CPU d'un logiciel de calculs paralleles intensifs sur une 
machine multiprocesseur, en decidant de ne laisser simultanement que trois processus ou 
threads concurrents en execution. On positionne le compteur initial a 3, et chaque hi d'execu- 
tion appellera P( ), puis V( ) avec une seule unite. 

Les operations offertes par les IPC Systeme V permettent de manipuler des ensembles de 
semaphores. II est possible de demander en une fois des operations Pn() ou Vn() indepen- 
dantes sur chaque semaphore d'un ensemble. Ces operations sont liees atomiquement, ce qui 
signihe que le noyau les realisera toutes ou n'en executera aucune. II peut aussi rester bloque 
longuement en attente d'une ressource. 

Finalement, etant donne qu'un processus peut se terminer a tout moment - notamment a 
cause d'un signal -, il est important de relacher automatiquement les semaphores qu'il main- 
tenait. Pour cela, les IPC proposent un mecanisme d'annulation programmable pour chaque 
action. Au moment de la hn du processus, le noyau effectue l'operation inverse de celle qui a 
ete realisee. Mais ceci complique a nouveau l'utilisation des semaphores. 

Les routines servant a manipuler les semaphores sont semgetO, qui accomplit une tache 
comparable a msgget( ) ou a shmget( ), semop( ) , qui regroupe les operations Pn() et Vn(), et 
semctl ( ) , qui permet entre autres de configurer ou de supprimer un ensemble de semaphores. 
Leurs prototypes sont declares dans <sys/sem. h> ainsi : 

int semget (key_t key, int nombre, int attributs); 

int semop (int identifiant, struct sembuf * operation, unsigned nombre); 
int semctl (int identifiant, int numero, 

int commande, union semun attributs); 

L'appel-systeme semgetO fonctionne comme ses confreres msggetO et shmgetO, avec 
simplement en second argument le nombre de semaphores dans 1' ensemble. Cette valeur n'est 
prise en compte que lors de la creation de la ressource, pas au moment de l'acces a un 
ensemble existant. Le troisieme argument peut contenir comme d'habitude IPC_CREAT, IPC_ 
EXCL et les autorisations d'acces. 

La routine semop ( ) sert a la fois pour les operations Pn() et Vn() sur de multiples semaphores 
appartenant au jeu indique en premier argument. Chaque operation est decrite par une struc- 
ture sembuf, dehnie dans <sys/sem.h> ainsi : 
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Type 


Signification 


sem_num 


short int 


Numero du semaphore concerne dans I'ensemble. La numerotation debute a zero. 


sem_op 


short int 


Valeur numerique correspondant a l'operation a realiser. 


sem_f 1 g 


short int 


Attributs pour l'operation. 



L'operation effectuee est determinee ainsi : 

• Lorsque le champ sem_op d'une structure sembuf est strictement positif, le noyau incre- 
mente le compteur interne associe au semaphore de la valeur indiquee et reveille les 
processus en attente. 

Quand sembuf . sem_op = n, avec n > 0, alors l'operation est Vn(). 
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• Lorsque le champ sem_op est strictement negatif, le noyau endort le processus jusqu'a ce 
que le compteur associe au semaphore soit superieur a sem_op, puis il decremente le comp- 
teur de cette valeur avant de continuer l'execution du processus. 

Quand sembuf . sem_op = n, avec n < 0, alors l'operation est Pn(). 

• Lorsque le champ setn_op est nul, le noyau endort le processus jusqu'a ce que le compteur 
associe au semaphore soit nul, puis il continue l'execution du programme. Cette fonction- 
nalite permet de synchroniser les processus. 

II existe deux options possibles pour le membre sem_f 1 g : 

• IPC_N0WAIT : l'operation ne sera pas bloquante, meme si le champ sem_op est negatif ou 
nul, mais l'appel-systeme indiquera l'erreur EAGAIN dans errno si l'operation n'est pas 
realisable. 

• SEMJNDO : pour etre sur que le semaphore retrouvera un etat correct meme en cas d'arret 
intempestif du programme, le noyau va memoriser l'operation inverse de celle qui a ete 
realisee et l'effectuera automatiquement a la fin du processus. Nous allons preciser ce 
mecanisme plus loin. 

En fait, la routine semopO prend en second argument une table de structures sembuf. Le 
nombre d' elements dans cette table est indique en derniere position. Le noyau garantit que les 
operations seront atomiquement liees, ce qui signifie qu'elles seront toutes realisees ou 
qu'aucune ne le sera. Bien entendu, il suffit qu'une seule operation avec sem_op negatif ou nul 
echoue avec l'attribut I PC_N0WAI T pour que toutes les modifications soient annulees. 

Pour implementer les fonctions P() et V() definies par Dijkstra, on peut done employer un 
ensemble avec un seul semaphore, qu'on manipulera ainsi : 

int 

P (int identifiant) 
{ 

struct sembuf buffer; 

buffer.sem_num = 0; 

buffer.sem_op = -1; 

buffer.sem_flg = IPCJJNDO; 

return semoptidentifiant, & buffer, 1); 

} 

int 

V (int identifiant) 
{ 

struct sembuf buffer; 

buffer.sem_num = 0; 

buffer.sem_op = 1; 

buffer.sem_flg = IPCJJNDO; 

return semoptidentifiant, & buffer, 1); 

} 

L'option SEMJJNDO employee lors d'une operation permet au processus de s'assurer qu'en cas 
de terminaison impromptue alors qu'il bloque un semaphore le noyau en restituera l'etat 
initial. Ceci est realise en utilisant un compteur par semaphore et par processus qui a demande 
un acces a l'ensemble. Ce mecanisme est done - legerement - couteux en memoire. Le noyau 
modifie l'etat de ce compteur a chaque operation sur le processus en y inscrivant l'operation 
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inverse. Si par exemple le processus effectue une operation Pn(), le noyau le bloque jusqu'a 
ce que le compteur du semaphore soit superieur a n, puis il diminue le compteur de cette 
valeur, et il augmente le compteur d'annulation du semaphore pour ce processus de la valeur 
n. Lorsque le processus realisera Vn(), le noyau augmentera le compteur du semaphore et 
reduira le compteur d'annulation. 

Lorsque le processus se termine, le noyau ajoute le compteur d'annulation a celui du semaphore. 
Si le processus a bien libere le semaphore, le compteur d'annulation est nul, et rien ne se passe. 
Si par contre le processus s'est termine apres avoir effectue Pn(), mais sans avoir realise Vn(), 
le compteur d'annulation vaut +n et le noyau libere ainsi automatiquement le semaphore. 

Une question peut se poser dans le cas inverse, si le noyau doit decrementer le compteur du 
semaphore lors de la fin d'un processus : doit-il attendre que le compteur du semaphore soit 
superieur a celui d'annulation, au risque de bloquer indefiniment ? La reponse est loin d'etre 
evidente. L implementation actuelle sous Linux consiste a diminuer immediatement le comp- 
teur, mais a limiter ce dernier a zero. D'autres systemes peuvent preferer bloquer indefiniment 
- a la maniere d'un processus zombie qui attend la lecture de son code de retour pour dispa- 
raitre entierement - pour garantir l'annulation de n'importe quelle operation. 

En realite, le probleme ne devrait pas exister. Hormis quelques cas particuliers servant a des 
experimentations sur les semaphores, on ne devrait jamais invoquer Vn() si Pn() n'a pas ete 
appelee auparavant. Naturellement, on peut toujours etre confronte a des bogues, notamment 
si on invoque Pn(), puis n fois VI () par exemple. 

En fait, dans les applications reelles, l'emploi des semaphores doit autant que possible etre 
restreint aux operations P() et V() sur un seul semaphore a la fois. On limitera egalement le 
compteur du semaphore a la valeur 1. Avec ces contraintes, l'utilisation des operations sur les 
semaphores ne pose pas de problemes particuliers. Si le processus risque de bloquer - ou 
d'etre tue - durant la portion critique ou il tient un semaphore, on emploiera l'option SEM_ 
UNDO. Bien sur, si on utilise une fois cette option, on prendra la precaution de le faire a chaque 
operation sur le semaphore. 

La fonction semctl ( ) permet de consulter ou de modifier le parametrage d'un jeu de sema- 
phore, mais egalement de fixer l'etat du compteur. Cette routine utilise traditionnellement en 
dernier argument une union definie ainsi : 

union semun { 



struct semid_ds * buffer; 
unsigned short int * table; 

} 

En fait, cette union n'est pas definie dans les fichiers d'en-tete systeme, elle doit etre declaree 
manuellement dans le programme utilisateur. En realite, le prototype de semctl ( ), vu par le 
compilateur, est en substance le suivant : 

int semctl (int identifiant, int numero, int commande, ...); 

Les points d' elision en fin de liste indiquent la presence eventuelle d'un argument supplemen- 
taire dont le type n'est pas mentionne. On peut done transmettre n'importe quel type de donnee, 
e'est la commande indiquee en troisieme position qui determinera la conversion. Pour garder 
une certaine homogeneite aux appels semctl (), on prefere generalement regrouper les 
diverses possibilites dans une union, qui permet quand meme une verification minimale. 
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valeur; 
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En fonction de la commande, le numero indique en seconde position et 1' union en dernier 
argument auront done des roles differents : 



Commande 


Signification 


IPC_STAT 


Remplir le membre buffer de I'union semun avec le parametrage de I'ensemble de semaphores. 
Le second argument de semctl ( ) est ignore. 


IPC_SET 


Utiliser le membre buffer de I'union semun pour parametrer les autorisations d'acces sur 
I'ensemble de semaphores. Le second argument de semctl ( ) est ignore. 


IPC_RMID 


Supprimer I'ensemble de semaphores. Tous les processus en attente sont reveilles et peuvent 
recevoir I'erreur EIDRM. Les second et quatrieme arguments sont ignores. 


GETALL 


Recopier la valeur de tous les semaphores de I'ensemble dans le membre table de la structure 
semun. Cette table doit etre correctement dimensionnee avec un unsigned short par semaphore. 
Le second argument est ignore. 


SETALL 


Fixer les compteurs de tous les semaphores de I'ensemble avec les valeurs contenues dans le 
membre tabl e de la structure semun. Les processus en attente sur un semaphore sont reveilles si 
son compteur augmente. La table doit etre correctement dimensionnee avec un unsi gned short 
par semaphore. Le second argument est ignore. 


GETVAL 


Lire la valeur du semaphore dont le numero est indique dans le second argument de semctl ( ). 
Cette valeur est renvoyee, tandis que le quatrieme argument est ignore. 


SETVAL 


Fixer la valeur du semaphore dont le numero est indique dans le second argument en employant le 
contenu du membre val eur de I'union semun. Les processus en attente sont reveilles au besoin. 


GETNCNT 


Renvoyer le nombre de processus en attente d'augmentation du compteur du semaphore dont le 
numero est indique en second argument. Le quatrieme argument est ignore. 


GETZCNT 


Renvoyer le nombre de processus en attente d'annulation du compteur du semaphore dont le 
numero est indique en second argument. Le quatrieme argument est ignore. 


GETPID 


Renvoyer le PID du processus ayant realise la derniere operation sur le semaphore dont le numero 
est indique en second argument. Le quatrieme argument est ignore. 



La structure semid_ds qui represente le parametrage d'un jeu de semaphore contient notam- 
ment les membres suivants : 



Norn 


Type 


Signification 


sem_perm 


struct ipc_perm 


Autorisations d'acces a I'ensemble de semaphores 


setn_otime 


time_t 


Heure de la derniere operation semopt ) 


setn_ctime 


time_t 


Heure de la derniere modification de sem_perm 


sem_nsems 


unsigned short 


Nombre de semaphores dans I'ensemble 



Lorsqu'un ensemble de semaphores est cree, les compteurs sont initialement vides. Aucun 
processus ne peut done se les attribuer. II faut done leur donner une valeur initiale a l'aide de 
la commande SETALL. En general, on verifie auparavant si le jeu existe deja ainsi : 

if ((sem = semget(cle, nb_sem, 0)) == -1) && (errno == ENOENT) ) { 
/* L'ensemble n'existe pas */ 

if ((sem = semget(cle, nb_sem, IPC_CREAT | IPC_EXCL | 0600)) == -1) { 
/* Pas assez de memoire par exempt e */ 
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perrort "semget" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

/* Maintenant qu'il est cree, on initialise les compteurs */ 
for (i = 0; i < nb_sem; i ++) 

tabl e_sem[i ]= 1; 
semun. table = table_sem; 
if (semctl (sem, 0, SETALL, semun) < 0) 

perror( "semctl " ) ; 

} 

/* L'ensemble peut a present etre utilise */ 

Un dernier mot avant de presenter un exemple complet d'emploi des semaphores, pour preciser 
l'utilisation de 1' operation semop( ) avec une valeur sem_op nulle. Cela sert, nous l'avons dit, a 
synchroniser des processus. En fait, on emploie surtout cette operation pour executer N 
processus, puis pour attendre qu'ils aient tous atteint un point particulier de leur deroulement 
avant de les laisser continuer. Pour cette technique de rendez-vous, on utilise un semaphore 
qu'on initialise a la valeur N. Chaque processus execute sa premiere partie, puis arrive au 
point de rendez-vous dans son code, il invoque P( ) pour decrementer la valeur du compteur, 
suivi d'une operation d'attente avec sem_op nulle. Lorsque tous les processus seront arrives a 
leurs points de rencontre respectifs, le compteur aura ete diminue de N, et atteindra done zero, 
lis pourront alors continuer leur execution, notamment en appelant V() pour restaurer le 
compteur du semaphore. En resume on a : 

/* Creation d'un semaphore */ 

if ((sem = semgettcle, 1, IPC_CREAT | IPC_EXCL | 0600)) == -1) { 
perror( "semget" ) ; 
exi t(EXIT_FAI LURE); 

} 

/* Initialisation */ 
table_sem[0]= N; 
semun. table = table_sem; 
if (semctl (sem, 0, SETALL, semun) < 0) 
perror( "semctl " ) ; 

} 

/* Depart des processus */ 
... forkO ... 

/* Point de rendez-vous */ 
/* PO */ 
sembuf .sem_num = 0; 
sembuf .sem_op =-1; 
sembuf .sem_flg = 0 
semoptsem, & sembuf, 1); 
/* Attente */ 
sembuf .sem_op = 0; 
semoptsem, & sembuf, 1); 
/* Rendez-vous 0k */ 
/* VO */ 
sembuf .sem_op = 1; 
semoptsem, & sembuf, 1); 

/* Suite */ 
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Ce procede fonctionne, car le noyau reveille tous les processus en attente quand le compteur 
arrive a zero, avant que les operations V( ) suivantes ne modifient a nouveau le semaphore. 

II manque dans ce programme la verification d'erreur sur semop( ), surtout en ce qui concerne 
la destruction du semaphore, alors que le processus est en attente dessus. 

Nous allons a present examiner un exemple plus complet puisqu'il emploie un semaphore 
pour autoriser l'acces a une zone de memoire partagee. Nous creerons un programme ecrivain 
qui permettra de saisir une chame de caracteres et de l'ecrire dans le segment de memoire 
partagee, et un processus lecteur qui affichera l'etat de cette memoire. 

Notre processus ecrivain maintiendra le semaphore pendant la saisie, ce qui permettra de le 
bloquer aussi longtemps que nous le desirerons et de lancer d'autres processus sur un terminal 
distinct. 

exemple_shmwrite.c : 

#include <stdio.h> 

#include <sys/types.h> 

#include <sys/ipc.h> 

#include <sys/sem.h> 

#include <sys/shm.h> 

#define LG_CHAINE 256 

typedef union semun { 

int val ; 

struct semid_ds * buffer; 

unsigned short int * table; 
} semun_t; 

int 

main (int argc, char * argv[]) 
{ 



key_t 


key 


int 


sem 


int 


shm 



struct sembuf sembuf; 
semun_t u_semun; 
char * chaine = NULL; 

unsigned short tabled]; 

if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s fichier_cle \n", argv[0]); 
exit(EXIT_FAILURE); 




if ((key = ftok(argv[l] , 0)) == -1) { 
perror( "ftok" ) ; 
exit(EXIT_FAILURE); 



if ((shm = shmget(key, LG_CHAINE, IPC_CREAT | 0600)) == -1) { 
perror( "shmget" ) ; 
exit(EXIT_FAILURE); 
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if ((chaine = shmat(shm, NULL, 0)) == NULL) { 
perror( "shmat" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

if ((sem = semgettkey, 1, 0)) == -1) { 

if ((sem = semgettkey, 1, IPC_CREAT | IPC_EXCL | 0600)) == -1) { 
perror( "semget" ) ; 
exi t(EXIT_ FAILURE); 

} 

chaine[0] = '\0' ; 
table[0] = 1; 
u_semun .tabl e = table; 
if (semctl (sem, 0, SETALL, u_semun) < 0) 
perror( "semctl " ) ; 



sembuf .sem_num = 0; 

sembuf .sem_op = -1; 

sembuf .sem_flg = SEMJJNDO; 

if (semoptsem, & sembuf, 1) < 0) { 

perror( "semop" ) ; 

exi t(EXIT_FAI LURE); 

} 

fprintf (stdout, "> "); 
fgetstchaine, LG_CHAINE, stdin); 

sembuf .sem_op = 1; 

if (semoptsem, & sembuf, 1) < 0) { 

perror( "semop" ) ; 

exi t(EXIT_FAI LURE); 

} 

return EXIT_SUCCESS; 

} 

Le programme lecteur attache le segment partage en lecture seule. 
exemple_shmread.c : 

#include <stdio.h> 
#include <sys/types.h> 
#include <sys/ipc.h> 
#include <sys/sem.h> 
#include <sys/shm.h> 



int 

main (int argc, char * argv[]) 
{ 

key_t key ; 

int sem; 

int shm; 

struct sembuf sembuf; 

char * chaine = NULL; 
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if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s fichier_cle \n", argv[0]); 
exit(EXIT_FAILURE); 

} 

if ((key = ftok(argv[l] , 0)) == -1) { 
perror( "ftok" ) ; 
exit(EXIT_FAILURE); 

} 

if (((sem = semget(key, 1, 0)) == -1) 
|| ((shm = shmgettkey, 0, 0)) == -1) ) { 
perror( "semget/shmget" ) ; 
exit(EXIT_FAILURE); 

} 

if ((chaine = shmattshm, NULL, SHM_RD0NLY) ) == NULL) { 
perror( "shmat" ) ; 
exit(EXIT_FAILURE); 

} 

sembuf .sem_num = 0; 

sembuf .sem_op = -1; 

sembuf .sem_flg = 0; 

if (semop(sem, & sembuf, 1) < 0) { 

perror( "semop" ) ; 

exit(EXIT_FAILURE); 

} 

fprintf (stdout, "£s\n", chaine); 

sembuf .sem_op = 1; 

if (semop(sem, & sembuf, 1) < 0) { 

perror( "semop" ) ; 

exit(EXIT_FAILURE); 

} 

return EXIT_SUCCESS; 

} 

Finalement, nous construisons un petit programme de suppression des ressources IPC employees. 
exemple_shmctl.c : 

#include <stdio.h> 

#include <sys/types.h> 

^include <sys/ipc.h> 

#include <sys/sem.h> 

#include <sys/shm.h> 

int 

main (int argc, char * argv[]) 
{ 

key_t key ; 
int sem; 
int shm; 

if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s fichier_cle \n", argv[0]); 
exit(EXIT_FAILURE); 
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} 

if ((key = ftok(argv[l] , 0)) == -1) { 
perrorC'ftok"); 
exi t( EXIT_FAI LURE) ; 

} 

if (((sem = semget(key, 1, 0)) == -1) 
|| ((shm = shmget(key, LG_CHAINE, 0)) == -1) ) { 
perror( "semget/shmget" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

shmctl (shm, I PC_RMID . NULL); 
semctKsem, I PC_RMID , 0); 
return EXIT_SUCCESS; 



Nous utilisons comme fichier-cle F executable exempl e_shmwrite. Verifions tout d'abord que 
les donnees persistent bien dans un segment partage apres 1' arret du processus ecrivain : 

$ . /exempl e_shmwrite exempl e_shmwrite 

> Channe numero 1 

$ . /exempl e_shmread exempl e_shmwrite 

Chatne numero 1 
$ 

Nous allons a present lancer le processus lecteur sur un second terminal, alors que les res- 
sources sont encore tenues par F ecrivain : 

$ . /exempl e_shmwrite exempl e_shmwrite 

$ . /exempl e_shmread exempl e_shmwrite 

> Channe numero 2 

$ 



II n'est pas facile de rendre compte ici de l'ordre d' execution des operations sur deux termi- 
naux, aussi nous encourageons le lecteur a experimenter lui-meme les divers cas de figure. On 
peut par exemple tuer avec Controle-C le processus ecrivain alors qu'il attend une saisie, et 
verifier qu'il a bien relache son semaphore grace au mecanisme d'annulation SEMJJNDO, en 
permettant ainsi au lecteur de s'executer : 

$ . /exempl e_shmwrite exempl e_shmwrite 

> (Controle-C) 

$ . /exempl e_shmread exempl e_shmwrite 

Chaine numero 2 
$ 

En fin de compte nous supprimons les ressources alors qu'un processus les emploie : 

$ . /exempl e_shmwrite exempl e_shmwrite 

$ . /exempl e_shmctl exempl e_shmwrite 
$ 

> Chaine numero 3 

semop: Parametre invalide 
$ 



Chaine numero 2 
$ 
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Nous voyons que le jeu de semaphore a ete detruit immediatement, ce qui declenche l'erreur 
sur semop( ). Par contre, le segment de memoire partage n'est supprime que lorsque le dernier 
processus a termine d'y faire reference. Ceci est heureux car nous aurions recu sinon un 
signal de faute de segmentation alors que nous utilisions la chaine de caracteres. 

Conclusion 

Nous l'avons deja dit, les IPC Systeme V font souvent office de parents pauvres dans les 
fonctionnalites standard disponibles sur les machines Unix. Reconnaissons que le principe 
des files de messages n'est pas tres performant, compare par exemple au systeme des sockets 
BSD que nous examinerons dans le chapitre 32. II ne permet pas de fonctionnement en reseau 
ni d' utilisation des mecanismes de multiplexage comme nous en verrons dans le prochain 
chapitre. 

Toutefois, pour des transferts rapides de gros volumes de donnees entre processus distincts, le 
systeme des segments de memoire partagee est parfaitement adapte, a condition de bien 
synchroniser les acces avec un dispositif comme les semaphores. L' implementation des sema- 
phores Systeme V est puissante, trop peut-etre, ce qui conduit a une complexite de 1' interface. 

Le travail simultane sur des ensembles complets de semaphores est une possibilite interes- 
sante pour des programmes experimentaux, mais pour des applications pratiques, surtout 
dans un contexte professionnel, il est largement conseille de limiter au maximum le nombre 
de semaphores a manipuler simultanement. 
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Nous allons nous interesser dans ce chapitre a plusieurs mecanismes differents permettant 
d'amehorer le fonctionnement des entrees-sorties. Nous allons d'abord observer comment 
permettre aux appels-systeme readO et writeO de ne plus etre bloquants, meme s'ils ne 
peuvent pas accomplir leurs taches immediatement. 

Nous etudierons ensuite le multiplexage des entrees-sorties. Cette technique, tres utilisee 
dans les communications entre processus et dans la programmation reseau, permet d'attendre 
simultanement sur plusieurs canaux l'arrivee de donnees ou la liberation d'un descripteur en 
ecriture. 

Finalement, nous examinerons une technique qui peut etre tres performante dans certaines 
circonstances, reposant sur des entrees-sorties asynchrones par rapport au deroulement du 
programme. Bien entendu, un certain nombre de precautions devront etre prises avec ce 
procede. 

Entrees-sorties non bloquantes 

Nous avons deja vu dans le chapitre 28 comment employer l'attribut 0_NONBL0CK lors de 
Fouverture d'un descripteur, afin d'eviter de rester bloque, meme si ce descripteur ne permet 
pas d'effectuer les operations demandees. Ceci est tres utile avec les tubes de communication 
et devient meme indispensable avec les liaisons serie sur certaines machines, lorsque le peri- 
pherique concerne ne gere pas le signal CD. Nous en reparlerons plus en detail dans le 
chapitre 33. 

Cependant nous n' avons pas pu obtenir du systeme qu'il nous laisse effectuer des appels- 
systeme readO ou writeO non bloquants sur des descripteurs obtenus autrement qu'avec 
open( ) , comme un tube ou des entrees-sorties standard. Ceci est malgre tout necessaire dans 
certains cas, pour verifier si des donnees sont arrivees depuis un descripteur correspondant 
par exemple au clavier, tout en continuant de mettre a jour regulierement des informations a 
Fecran. Notons que cet exemple n'est peut-etre pas tres judicieux car le clavier, comme nous 
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l'avons deja remarque dans le chapitre 10, ne permet pas dans sa configuration par defaut de 
capturer des caracteres au vol sans appuyer sur la touche Entree. Nous verrons aussi dans le 
chapitre 33 comment resoudre ce probleme. 

Quoi qu'il en soit, nous aimerions disposer de la faculte de lire les donnees sur un descripteur, 
sans que cela nous bloque si rien n'est disponible, ou d'ecrire dans un tube avec une fonction 
qui nous signale simplement une erreur si le tube est plein. Ceci est possible en modifiant le 
comportement du descripteur grace a l'appel-systeme fcntl ( ) que nous avons deja rencontre 
dans le chapitre 19. Rappelons que son prototype est defini dans <f cntl . h> ainsi : 

int fcntl (int fd, int commande, ...); 

Ici la commande employee est celle qui modifie l'attribut du fichier F_SETFL, et nous inserons 
dans le troisieme argument l'attribut 0_N0NBL0CK. Dans notre premier exemple, nous allons 
reprendre le principe d'un programme que nous avons utilise dans le chapitre 28, en remplis- 
sant entierement un tube. Par contre, nous basculons le descripteur de l'entree du tube en ecri- 
ture non bloquante. Ainsi, les appels writeO apres la saturation du buffer (de dimension 
PIPE_BUF, soit 4 096 sur un PC) echoueront sans rester bloques. Lorsqu'une tentative d'ecri- 
ture echoue, on endort le processus pendant une seconde pour eviter de consommer inutile- 
ment du temps CPU. 

exemple_nonblock_1.c : 

#incl ude <fcntl .h> 
//include <stdio.h> 
//include <stdlib.h> 
//include <unistd.h> 

int 
main (void) 
{ 

int tube[2]; 
char c = 'c* ; 
int i ; 

if (pipe(tube) != 0) { 
perrorCpipe"); 
exit(EXIT_FAILURE); 

} 

fcntl (tubed], F_SETFL, fcntl (tubed] . F_GETFL) | 0_N0NBL0CK); 
i = 0; 
while (1) { 

if (writeUubedL & c, 1) != 1) { 
perror( "write" ) ; 
sleep(l) ; 
} el se 
i ++; 

fprintf (stdout, "%d octets ecrits \n", i); 

} 

return EXIT_SUCCESS; 

} 
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L' execution illustre bien le comportement attendu. On arrete le programme en interrompant 
sa boucle avec Controle-C. 

$ ./exemple_nonblock_l 

1 octets ecrits 

2 octets ecrits 

3 octets ecrits 
[...] 

4094 octets ecrits 

4095 octets ecrits 

4096 octets ecrits 

write: Ressource temporai rement non disponible 
4096 octets ecrits 

write: Ressource temporai rement non disponible 
4096 octets ecrits 

write: Ressource temporai rement non disponible 
4096 octets ecrits 

write: Ressource temporai rement non disponible 
(Controle-C) 

$ 

Le message « Ressource temporai rement non disponible » correspond a l'erreur EAGAIN, qui 
indique que l'ecriture est momentanement impossible en attendant que le buffer soit vide par 
la sortie du tube. 

Dans ce programme, nous lisons d'abord la configuration du descripteur avec la commande 
F_GETFL de fcntlO, avant de la modifier en ajoutant l'attribut 0_NONBLOCK. Cette 
methode est preferable, mais on rencontre des applications qui installent directement l'attribut 
0 N0NBL0CK sans se soucier de l'etat precedent. Le nombre d'attributs etant ires restreint 
(0 N0NBL0CK, 0_APPEND, 0_SYNC), certains programmeurs manipulent directement la configura- 
tion globale sans travailler option par option. 

Dans notre second exemple, nous allons examiner la lecture non bloquante. Un processus va 
se scinder en deux, le processus fils assurant une ecriture toutes les 700 millisecondes dans un 
tube. Le pere essaye de lire toutes les 100 millisecondes, aussi certaines lectures reussissent- 
elles quand des donnees sont disponibles, tandis que d'autres echouent. 

exemple_nonblock_2.c : 

#include <fcntl .h> 

#include <stdio.h> 

finclude <stdlib.h> 

#include <unistd.h> 

int 
main (void) 

{ 

int tube[2]; 
char c; 

if (pipe(tube) !=0) { 
perrorC'pipe"); 
exit(EXIT_FAILURE); 
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switch (forkO) { 
case -1 : 

perror( "fork" ) ; 
exit(EXIT_FAILURE); 
case 0 : /* fils : ecriture */ 
close(tube [0]); 
while(l) { 

write(tube[l], & c, 1); 
usleep(700000) ; 

} 

default : /* pere : lecture */ 
cl ose(tube[l] ) ; 
fcntl (tube[0], F_SETFL, 

fcntl (tube[0], F_GETFL) | 0_N0NBL0CK); 
while (1) { 

if (read (tube[0], & c, 1) == 1) 
printfC'Ok \n"); 

el se 

printf("Non \n"); 
usleep(lOOOOO) ; 

} 

} 

return EXIT_SUCCESS; 

} 

Le programme assure bien une tentative reguliere de lecture sans se laisser perturber par ses 
echecs ni par ses succes. 

$ ./exemple_nonblock_2 
Non 

Ok 

Non 

Non 

Non 

Non 

Non 

Ok 

Non 

Non 

Non 

Non 

Non 

Ok 

Non 

Non 

Non 

Non 

Non 

Non 

Ok 

Non 
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(Controle-C) 



Nous n'avons pas affiche de message d'erreur complet, mais la fonction read( ) renvoie aussi 
le code E AGAIN dans errno quand une lecture ne donne rien sur un descripteur non bloquant. 
Le comportement des operations read ( ) et write ( ) non bloquantes est le suivant : 



Appel 


Situation du descripteur 




Resultat 


readt ) 


Aucune donnee disponible 


retour 


zero, errno = EAGAIN 




Moins de donnees disponibles que le nombre demande 


retour 


quantite lue 




Autant ou plus de donnees disponibles que le nombre demande 


retour 


quantite demandee 


wri te( ) 


Pas de place 


retour 


zero, errno = EAGAIN 




Pas assez de place pour toute la quantite a ecrire 


retour 


quantite ecrite 




Suffisamment de place pour toute I'ecriture 


retour 


quantite demandee 



A ceci s'ajoutent bien entendu les valeurs de retour inferieures a zero (normalement -1) qui 
correspondent a des erreurs d' entree-sortie de bas niveau. Dans nos programmes precedents, 
nous ecrivions un seul caractere a la fois, mais en realite on doit generalement ecrire quelque 
chose comme : 

int retour; 

retour = readtfd, buffer, taille); 
if (retour == -1) { 

perror( "read" ) ; 

exi t( EXIT_FAI LURE) ; 

} 

if (retour!= 0) 

traite_donnees_dans_buffer( buffer, taille); 

II faut noter que le fait d'ouvrir un descripteur avec l'attribut 0_N0NBL0CK est parfois indispen- 
sable, alors que nous voudrions par la suite que les lectures et ecritures soient bloquantes. 
C'est le cas par exemple lors de Fouverture des deux extremites d'un tube nomme dans le 
meme processus. Dans cette situation, on utilise alors un arrangement comme celui-ci : 

fd = open (nom_du_fi chi er, 0_RD0NLY | 0_NONBLOCK); 
if (fd >= 0) { 

fcntKfd, F_SETFL, fcntKfd, F_GETFL) & (~0_N0NBL0CK) ) ; 

} 

Avec les lectures et ecritures non bloquantes, nous pouvons deja ecrire des applications avec 
un comportement assez dynamique, dont le deroulement continue imperturbablement, que 
des donnees arrivent ou non. Voici par exemple un squelette de jeu dans lequel on lit le clavier 
de maniere non bloquante : 

int 
main (void) 

char touche; /* Pan ! */ 
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fcntl ( STDI N_FI LENO , F_SETFL, 0_N0NBL0CK); 
while (1) { 

if (calcul_des_nouveaux_evenements( ) == FIN_PARTIE) 
break; 

if ( read ( STDI N_FI LENO , & touche, 1) == 1) 

cal cul_depl acement_joueur(touche) ; 
aff i chage_nouvel 1 e_si tuation( ) ; 
usleep(UN_25EME_DE_SEC0NDE); 

} 

af f i chage_du_score( ) ; 
return EXIT_SUCCESS ; 

} 

De meme, les ecritures non bloquantes peuvent etre tres utiles lorsque remission de donnees 
vers un autre processus est une fonctionnalite annexe ne devant en aucun cas freiner le cours 
de l'application principale. Ceci concerne par exemple les sorties de journalisation d'un 
systeme temps-reel - sauf bien entendu lorsque cette journalisation est consideree comme 
un mecanisme de boite noire dont l'importance est cruciale pour le suivi de l'application. 

Dans le cas d'un processus serveur ayant des connexions par tube - ou socket reseau - avec 
de multiples clients, on pourrait etre tente d'ecrire une boucle principale comme : 

while (1) { 

for (i =0; i < nombre_de_clients; i ++) 

if (read(tube_depuis_client[i], & requete, sizeof(requete_t)) 
== sizeof(requete_t)) 
repondre_a_l a_requete( i , & requete); 

} 

Toutefois ce code serait tres mauvais, car il accomplirait la plupart du temps des boucles 
vides, consommant inutilement et exagerement du temps processeur. La seule situation ou on 
pourrait tolerer ce genre de comportement serait dans des portions courtes de logiciel temps- 
reel, ou on attend simultanement des messages sur plusieurs canaux de communication, et 
quand la reponse doit etre fournie dans un delai ne tolerant pas le risque que le processus soit 
endormi temporairement. Hormis ce cas tres particulier, on se tournera plutot vers le meca- 
nisme d'attente passive permettant un multiplexage des entrees. 

Attente d'evenements - Multiplexage d'entrees 

On a souvent besoin, principalement dans les applications de serveur reseau, de surveiller 
l'arrivee de donnees en provenance de multiples sources. Mais etant donne que toutes les 
entrees-sorties ont lieu sous le controle du noyau, il est generalement inutile d'effectuer des 
boucles d'attente active comme nous l'avons vu a la section precedente. L'appel-systeme 
selectO - apparu en 1982 dans BSD 4.2 - et l'appel pollO - integre a Systeme V R3 
en 1986 - permettent de dire en substance au noyau : « Voici la liste des descripteurs qui 
m'interessent, previens-moi s'il se passe quelque chose, en attendant je fais un petit somme. » 
L'application relache entierement le processeur, au benefice des autres programmes. Quand 
des donnees arrivent, quel que soit le type de descripteur, elles passent par le noyau, qui se 
souvient alors qu'un processus est en attente et peut le reveiller en lui indiquant que des infor- 
mations sont pretes a etre lues. 
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Ces appels-systeme sont essentiels dans de nombreuses situations. lis sont decrits SUSv3. 
L'appel sel ect( ) est plus employe que pol 1 ( ) meme si sa syntaxe est plus compliquee, aussi 
le decrirons-nous en premier. II est declare dans <sys/types . h> ainsi : 

int selectd'nt nb_descripteurs , 

fd_set * ensemble_a_lire, 
fd_set * ensembl e_a_ecri re, 
fd_set * ensembl e_exceptions, 
struct timeval * del ai_maxi ) ; 

II prend en arguments trois pointeurs sur des ensembles de descripteurs, un pointeur NULL 
correspondant a un ensemble ignore : 

• Le premier ensemble est surveille par le noyau en attente de donnees a lire. Des que des 
informations sont disponibles, le processus est reveille. Nous etudierons d'abord ce prin- 
cipe. 

• Les descripteurs du second ensemble correspondent a des sorties du processus. On desire 
ici qu'un de ces descripteurs accepte de recevoir des donnees. On attend par exemple 
qu'un buffer se vide en liberant de la place ou qu'un processus lecteur ait ouvert un tube 
nomme. 

• Le troisieme ensemble est rarement utilise car il contient des descripteurs sur lesquels on 
attend l'arrivee de conditions exceptionnelles. Ceci correspond generalement a l'arrivee de 
donnees urgentes hors bande sur une socket reseau TCP. 

L'appel-systeme selectO permet aussi de configurer un delai d'attente maximal. Lorsque 
celui-ci est ecoule, le noyau termine l'appel avec un code de retour nul. Cette fonctionnalite a 
longtemps ete utilisee pour endormir un processus, de maniere portable, avec une meilleure 
precision que la seconde. En effet, l'appel sel ect( ) est plus repandu que nanosl eep( ) et offre, 
grace a la structure timeval, la possibilite de configurer un sommeil avec une resolution de 
l'ordre de la microseconde. On emploie un code du genre : 

struct timeval attente; 

attente. tv_sec = delai_en_microsecondes / 1000000; 
attente. tv_usec = del ai_en_microsecondes % 1000000; 
select(0, NULL, NULL, NULL, & attente); 

Lorsque le pointeur sur la structure timeval est NULL, l'appel-systeme reste bloque indefini- 
ment en attente d'une condition favorable sur un descripteur. Si, au contraire, la valeur du 
delai vaut 0, l'appel revient immediatement sans bloquer. 

Le premier argument de select( ) est finalement le plus complique. II s'agit du numero du 
plus grand descripteur de fichier contenu dans les ensembles surveilles, augmente de 1. Ceci 
sert au noyau pour dimensionner un masque de bits lui indiquant en interne quels descripteurs 
surveiller. Pour positionner cette valeur, on peut employer par exemple : 

pi us_grand_descri pteur = -1; 
for (i =0; i < nombre_de_descripteurs; i ++) 
if (descripteur[i ] > plus_grand_descripteur) 
pi us_grand_descripteur = descripteur[i] ; 
select(plus_grand_descripteur +1, ...); 

Sachant que le noyau fournit les descripteurs de fichiers dans l'ordre, en commencant par 0, 1 
et 2, qui sont attribues aux flux standard d' entree, de sortie et d'erreur, on peut aussi avoir 
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recours a quelques astuces, dont la plus courante est d'employer la constante symbolique FD_ 
SETSIZE, qui correspond a la taille maximale d'un ensemble de descripteurs. 

Ces ensembles sont du type opaque f d_set. On les manipule par le biais des macros suivantes : 

FD_ZER0 (fd_set * ensemble); 

FD_SET (int fd, fd_set * ensemble); 

FD_CLR (int fd, fd_set * ensemble); 

FD_ISSET (int fd, fd_set * ensemble); 

La macro FD_ZER0() permet d'initialiser un ensemble vide. II faut toujours l'employer au 
debut de Futilisation d'un ensemble. La macro FD_SET() ajoute un descripteur dans un 
ensemble, tandis que FD_CLR() en supprime un. Enfin, FD ISSEK ) permet de verifier si un 
descripteur est present ou non dans un ensemble. 

En effet, au retour de sel ect( ), l'appel-systeme renvoie le nombre de descripteurs se trouvant 
dans les conditions attendues et modifie les ensembles passes en arguments, pour n'y laisser 
que les descripteurs concernes. Si l'appel-systeme selectt ) est interrompu par un signal, il 
renvoie -1 et configure EINTR dans errno. 

Nature llement, on utilise selectO uniquement sur des descripteurs correspondant a des 
tubes, des FIFO, des fichiers speciaux de peripheriques ou des sockets reseau. Si toutefois on 
transmet un descripteur de fichier regulier, sel ect( ) considere que des donnees sont disponi- 
bles tant qu'on n'est pas arrive a la fin du fichier. 

En oubliant pour le moment les descripteurs en attente d'ecriture et de conditions exception- 
nelles, nous pouvons considerer le multiplexage de plusieurs lectures : 



attente. tv_sec = delai_maxi; 
attente. tv_usec = 0; 
/* initialisation de 1 'ensemble */ 
FD_ZER0(& ensemble); 
for (i=0; i < nb_descri pteurs ; i ++) { 
if (descripteur[i] > FD_SETSIZE) { 

fprintf (stderr, "Descripteur trop grand \n") ; 

return -1; 



FD_SET(descripteur[i ] , & ensemble); 
if (descripteur[i] > plus_grand) 
plus_grand = descripteur[i]; 

} 

/* attente */ 
do { 




int 

attente_reception (int descripteurs[] , 

int nb_descripteurs, 

int delai_maxi ) 



struct timeval attente; 

fd_set ensemble; 

int plus_grand = -1; 

int i ; 

int retour; 
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retour = select(plus_grand + 1, 



& ensemble, NULL, NULL, 
& attente) ; 



} while ((retour == -1) && (errno == EINTR)); 



if (retour < 0) { 
perror( "sel ect" ) ; 
return -1; 



if (retour == 0) { 

fprintf (stderr, "del ai depasse \n"); 
return -1; 



/* examen des descripteurs prets */ 
for (i =0; i < nb_descripteurs ; i ++) 

if (FD_ISSET(descripteur[i], & ensemble)) 
lecture_descripteur(descripteur[i ] ) ; 
return 0; 



Nous controlons que les descripteurs ont bien une valeur inferieure a FD_SETSIZE. C'est une 
attitude vraiment paranoiaque, ayant rarement cours dans les applications courantes, le 
risque de depasser cette valeur etant infime (sauf si on ouvre a repetition un descripteur en 
oubliant de le refermer). 

Dans le programme suivant, nous creons 10 fils et 10 tubes de communication avec leur pro- 
cessus pere. Ce dernier va surveiller les arrivees avec select( ). Les 10 fils enverront regu- 
lierement un caractere a leur pere, chacun avec une frequence differente variant entre une 
fois par seconde et une fois toutes les dix secondes. II manque de nombreuses verifications 
d'erreur, qui auraient alourdi inutilement le listing. 

exemple_select.c : 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <sys/types.h> 

#define NB_FILS 10 



for (i = 0; i < NB_FILS; i ++) 
if (pipe(tube[i]) < 0) { 
perrorC'pipe") ; 
exit(EXIT_FAILURE); 

} 

for (fils = 0; fils < NB_FILS; fils ++) 



int 
main (void) 



int 

fd_set 



tube[NB_FILS][2]; 



ensembl e; 
i, fils; 
C = 'c' ; 



int 
char 
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if (forkO == 0) 
break; 

for (i = 0; i < NB_FILS; 1 ++) 
if (fils == NB_FILS) { 

/* On est dans le pere */ 
close(tube[i][l]); 
} else { 

close(tube[i][0]); 
if (i != fils) 

close(tube[i][l]); 

} 

if (fils == NB_FILS) { 
while (1) { 

FD_ZER0(& ensemble); 

for (i =0; i < NB_FILS; i ++) 

FD_SET(tube[1][0], & ensemble); 
if (select(FD_SETSIZE, & ensemble, NULL, NULL, NULL) < 0){ 
perrorCselect" ) ; 
break; 

} 

for (i = 0; i < NB_FILS; i ++) 

if (FD_ISSET(tube[i][0], & ensemble)) { 
fprintf (stdout, "%d ", i); 
fflush(stdout) ; 
read(tube[i][0], & c, 1); 

} 

} 

} else { /* On est dans un fils */ 
while (1) { 

usleep((fils + 1) * 1000000); 
write(tube[fils][l], & c, 1); 

} 

} 

return 0; 

} 

Lors de son execution, ce programme adopte bien le comportement dynamique qu'on attend, 
tout en evitant de faire des boucles actives consommatrices inutiles de ressources processeur. 

$ ./exemple_select 

010203104052106073108209410 
(Controle-C) 

$ 

Lorsqu'un appel-systeme selectO se termine avant que le delai maximal soit ecoule, soit 
parce qu'un descripteur est pret, soit parce qu'un signal Fa arrete, le noyau Linux modifie le 
contenu de la structure timeval passee en dernier argument afin qu'elle contienne la duree 
restante non ecoulee. Ce comportement est bien commode dans certains cas, notamment 
lorsqu'on implemente un bouclage pour ignorer les interruptions dues aux signaux : 

do { 

retour = select (FD_SETSIZE. & ensemble, NULL, NULL, & attente); 
} while ((retour == -1) && (errno == EINTR) ) ; 
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Toutefois, il faut savoir que ce comportement n'est pas portable. La plupart des autres Unix 
de la famille Systeme V ne modifient pas ce delai. Le meme probleme peut se poser pour 
porter sous Linux une application qui considere que cette variable n'est pas modifiee et la 
reutilise directement. Pour pallier ce probleme, le noyau Linux offre la possibilite de modifier 
la personnalite du processus grace a l'appel-systeme personal ity( ). Ce dernier permet de 
demander au noyau d' adopter, avec ce processus, une attitude differente dans certains appels- 
systeme, ainsi que de numeroter autrement les signaux. Nous ne detaillerons pas cette fonc- 
tion car elle est tres specifique et peu recommandee. II vaut mieux corriger 1' application 
defectueuse que de demander au noyau d'emuler les bogues des autres systemes. 

Pour revenir au probleme de la modification du delai, 1' attitude la plus prudente consiste a ne 
pas faire de supposition concernant l'etat de la variable et a la remplir a nouveau avant chaque 
appel, en calibrant la nouvelle attente avec gettimeofday ( ). 

Une variante de sel ect( ), nominee pselect( ) est disponible, mais moins utilisee : 

int selectd'nt nb_descripteurs, 

fd_set * ensemble_a_lire, 
fd_set * ensembl e_a_ecri re, 
fd_set * ensembl e_exceptions, 
struct timeval * delaijaxi, 
const sigset_t * signaux); 

Elle prend un argument supplementaire par rapport a sel ect( ) : c'est le masque des signaux 
qui sera utilise durant 1' attente. Ceci permet d'attendre de maniere fiable et simultanee 
Foccurrence de signaux (que Ton bloque en dehors de l'appel systeme pour ne pas risquer 
d'en perdre) et de situations sur des descripteurs. 

II existe un autre appel de multiplexage, pollO, issu de l'univers Systeme V, declare dans 
<poll .h> : 

int poll (struct pollfd * pollfd, 

unsigned int nb_structures , 
int delaijaxi ); 

Les descripteurs a surveiller sont indiques dans une table de structures pol 1 f d, contenant les 
membres suivants : 



Nom 


Type 


Signification 


fd 


Int 


Descripteur de fichier a surveiller. 


events 


short int 


Liste des evenements qui nous interessent concernant ce descripteur. 


revents 


short int 


Ensemble des evenements survenus, au retour de l'appel-systeme. 



Le noyau examine done les evenements attendus sur chaque descripteur et modifie le membre 
revents avant de revenir de l'appel-systeme. Les evenements qui peuvent survenir sont les 
suivants : 

Nom Signification 

POLLI N Donnees disponibles pour la lecture 
POLLOUT Descripteur pret a recevoir des donnees 
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Norn 


Signification 


POLLPRI 


Donnees urgentes disponibles (informations hors bande sur connexion TCP) 


POLLERR 


Erreur survenue sur le descripteur (uniquement en reponse dans revents) 


POLLHUP 


Deconnexion d'un correspondant (uniquement en reponse dans revents) 


POLLNVAL 


Descripteur invalide (uniquement en reponse dans revents) 



Comme selectO, pollO renvoie normalement le nombre de structures pour lesquelles il 
s'est passe quelque chose (eventuellement une erreur) et une valeur nulle si le delai est 
depasse. S'il est interrompu par un signal, pol 1 ( ) renvoie -1 et positionne errno avec EINTR. 

L'avantage de pol 1 ( ) par rapport a sel ect( ) c'est qu'il n'y a pas de limite absolue au nombre 
de descripteurs surveilles simultanement. Par contre, cette fonction est nettement moins 
repandue que sel ect( ) dans les Unix de la famille BSD. Les programmeurs preferent done 
generalement employer sel ect( ). 



Distribution de donnees - Multiplexage de sorties 

Le multiplexage de donnees en sortie est plus rare, car un processus qui veut envoyer des 
donnees a un correspondant prefere souvent rester bloque quelque temps mais etre sur que ses 
informations sont emises. II est toutefois possible d' avoir a ecrire un volume important de 
donnees sur plusieurs descripteurs simultanement. On peut alors implementer un systeme 
de memoire tampon, avec lequel on ecrit avec des write ( ) non bloquants sur les descripteurs 
qui sont prets. 

On peut aussi cumuler un multiplexage d'entrees et de sorties dans le meme appel sel ect( ). 
Supposons qu'on recoive de maniere continue des donnees provenant d'un tube source et 
qu'on doive les distribuer autant que possible vers des tubes cibles. On pourrait utiliser un 
buffer de sortie pour chaque cible. Une implementation pourrait etre : 



int 

distribution (int source, int cibles [], 
{ 

ensemble_lecture; 
ensemble_ecriture; 



int nb_cibles) 



fd_set 
fd_set 
int 

char ** 
int * 
char 
int 
int 



1 ; 

buffer_cible = NULL; 
contenu_buffer = NULL; 
buffer_source[LG_BUFFER] : 
contenu_source; 
nb_ecrits; 



/* Allouer un tableau de buffers (1 pour chaque source) */ 
/* avec un indicateur du contenu pour chaque buffer */ 
if ( (contenu_buffer = calloc(nb_cibles, sizeof (int))) == NULL) 
return -1; 

if ( (buffer_cible = calloc(nb_cibles, sizeof(char *))) == NULL) { 
f ree(contenu_buffer) ; 
return -1; 

} 
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/* Allouer les buffers proprement dits */ 
for (i = 0; i < nb_cibles; i ++) { 

if ((buffer_cible[i] = mal 1 oc( LG_BUFFER) ) == NULL) { 
while (--i >= 0) 

f ree(buffer_cible[i] ) ; 
f ree(buffer_cible) ; 
free(contenu_buffer) ; 
return -1; 

} 

contenu_buffer[i ] = 0; 

} 

while (1) { 

FD_ZER0(& ensemblejecture); 
FD_SET(source, & ensemble_lecture) ; 
FD_ZER0(& ensembl e_ecriture) ; 
for (i =0; i < nb_cibles; i ++) 
if (contenu_buffer[i ] > 0) 

/* II reste des donnees a ecrire sur cette cible */ 
FD_SET(cibles[i] , & ensemble_ecriture) ; 
/* Attendre l'arrivee de donnees ou la liberation */ 
/* d'une cible vers laquelle il reste des donnees a ecrire */ 
while (select(FD_SETSIZE, 

& ensemble_lecture, & ensembl e_ecriture, NULL, 
NULL) < 0) 
if (errno != EINTR) 
perror( "sel ect" ) ; 

if (FD_ISSET(source, & ensembl e_l ecture) ) { 
/* II y a des donnees a lire */ 

contenu_source = read(source, buffer_source, LG_BUFFER); 
if (contenu_source > 0) 

/* On les transmet dans les buffers des cibles */ 
for (i =0; i < nb_cibles; i ++) 

if (contenu_source + contenu_buffer [i] < LG_BUFFER) { 
/* II y a assez de place sur cette cible */ 
memcpy (& (buffer_cibl e[i ][contenu_buffer[i ]] ) , 
buffer_source, 
contenu_source) ; 
contenu_buffer[i ] += contenu_source; 
} else { 

/* la cible ne lit pas assez vite, on copie ce */ 
/* qu'on peut. */ 
memcpy (&(buffer_cibl e[i ][contenu_buffer[i ]] ) , 
buffer_source, 

LG_BUFFER - contenu_buf f er[i ] ) ; 
contenu_buffer[i] = LG_BUFFER; 

} 

} 

for (i = 0; i < nb_cibles; i ++) { 

if (FD_ISSET(buffer_cible[i] , & ensemble_ecriture) ) { 
/* II y a de la place liberee sur la cible */ 
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} 

} 

} 

} 

On imagine bien la puissance de l'appel-systeme selectO, puisqu'il permet de centraliser 
totalement la surveillance de multiples canaux de communication, 1' application etant prete a 
reagir immediatement lorsque des donnees arrivent ou des qu'un descripteur de sortie est 
libre. 

Ce mecanisme est particulierement precieux des qu'une application doit se comporter en 
serveur vis-a-vis de multiples clients, mais il est parfois insuffisant. Une application fonction- 
nant sous X-Window par exemple doit invoquer lors de son initialisation une routine de 
boucle principale fournie par les bibliotheques graphiques, generalement XtAppMai nLoop( ), 
qui ne lui rend pas la main mais invoquera les fonctions callback associees aux composants 
graphiques lors de leurs activations. Un tel programme ne peut done pas rester bloque sur 
sel ect( ). 

Une solution possible est d' employer un f ork( ) avant F initialisation graphique, pour laisser 
le processus fils s'occuper de tout le dialogue avec les clients alors que le processus pere ne 
gere que Finterface graphique. La communication entre les processus est reduite au 
minimum, et s'etablit au moyen de deux tubes et de signaux. 

Nous pouvons egalement utiliser le mecanisme des entrees-sorties asynchrones offert par 
l'appel-systeme fcntl ( ). 

Entrees-sorties asynchrones avec fcntl() 

L'appel-systeme fcntl ( ), que nous avons deja rencontre dans le chapitre 19, permet d'imple- 
menter un mecanisme d' entrees-sorties asynchrones assez interessant car il offre un multi- 
plexage des entrees ou des sorties comme avec select( ), tout en laissant le processus libre 
d'executer du code au lieu de le bloquer en attente. 

Ce systeme est plutot reserve aux tubes de communication ou aux sockets. Le principe 
consiste a associer au descripteur de fichier le PID du processus, et de laisser le noyau nous 
prevenir lorsque des donnees seront disponibles en lecture ou lorsqu'il y aura a nouveau de la 
place pour ecrire dans le descripteur. Des que l'une de ces conditions se presente, le noyau 
nous envoie le signal SIGIO. 

Nous avons done une sorte d' equivalent de sel ect( ), puisque nous serons prevenus lorsqu'une 
condition d' entree-sortie sera realisee, tout en conservant la liberte d'executer le reste du 
programme. 



nb_ecrits = wn'te(cibles[i], 

buffer_cibl e[i ] , 
contenu_buffer[i ] ) ; 
if (nb_ecrits > 0) { 

memmove(buffer_cible[i ] . 

& (buffer_cibl e[i ][nb_ecrits] ) . 
contenu_buffer[i ] - nb_ecrits); 
contenu_buffer[i ] -= nb_ecrits; 

} 
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Les commandes employees avec fcntl ( ) sont les suivantes : 

• F_SET0WN : on indique le PID du processus devant recevoir le signal. Un PID negatif 
correspond a un groupe de processus. 

Normalement, on utilise fcntl (fd, F_SET0WN, getpidO). 

• F_GET0WN : l'appel fcntl (fd, FJ3ET0WN) renvoie le PID du processus ou du groupe recep- 
teur. 

• F_SETSIG : ceci permet de configurer le numero du signal a employer pour prevenir des 
modifications de conditions. Par defaut ou en cas de valeur nulle, le signal SIGIO est 
envoye. Toutefois, nous prefererons utiliser un signal temps-reel, car des informations 
supplementaires seront disponibles. Nous pouvons employer un signal different pour 
chaque descripteur, quoique cela ne soit pas indispensable avec les signaux temps-reel. 

On appellera done fcntl (fd, F_SETSIG, SIGRTMIN + 5). 

• F_GETSIG : avec fcntl (fd , F_GETSIG), on peut connaitre le numero de signal employe. 

Le gestionnaire de signaux recoit, s'il s'agit d'un signal temps-reel, une structure siginfo 
dont le champ si_code contient la valeur SLSIGIO, et le membre si_fd le descripteur du 
fichier concerne. Si on utilise le signal SIGIO d'origine, le gestionnaire ne dispose pas de cette 
structure siginfo, il devra done employer selectO avec un delai nul pour determiner quel 
descripteur est devenu disponible. 

Pour activer le comportement asynchrone, il faut faire appel a la commande F_SETFL de 
fcntl ( ) et activer l'attribut 0_ASYNC ainsi : 

fcntl (fd, F_SETFL, fcntl (fd, F_GETFL) | 0_ASYNC); 

Notons qu'a la difference de selectt ) le noyau nous previent ici lorsque les conditions de 
lecture ou d'ecriture sont modifiees. Si des donnees sont disponibles en lecture avant l'activa- 
tion de 0_ASYNC ou s'il y a deja de la place pour l'ecriture, nous n'en serons pas prevenus. Une 
solution consiste a s'envoyer systematiquement un signal juste apres le basculement en mode 
asynchrone et a verifier au sein du gestionnaire l'etat du descripteur, a l'aide d'un appel 
sel ect( ) avec un delai nul. 

Ces possibilites sont interessantes, malheureusement de nombreuses versions du noyau Linux 
(y compris dans les branches 2.4 et 2.6) n'implementent pas correctement ces fonctionnalites, 
et il est difficile d'obtenir un programme qui s'execute bien sur les differents noyaux disponi- 
bles. Toutefois nous pourrons resoudre ce probleme en nous tournant vers un autre meca- 
nisme - totalement portable celui-ci : l'asynchronisme introduit par la norme Posix.lb. et 
defini de nos jours par SUSv3. 

Entrees-sorties asynchrones Posix.lb 

Jusqu'a present nous avons reussi a optimiser la communication sur plusieurs canaux simul- 
tanement grace au multiplexage de sel ect( ), et a laisser le programme se derouler normale- 
ment en reiterant de temps a autre les tentatives d'entree-sortie. 

Toutefois ces mecanismes ne sont pas suffisants dans le cas oil on desire vraiment recevoir ou 
emettre des donnees de maniere sufHsamment fiable, avec un mode operatoire totalement 
asynchrone par rapport au reste du programme. En effet, lorsque selectO - ou un signal 
programme par fcntl ( ) - nous indique que des donnees sont disponibles en lecture, tout ce 
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que nous savons c'est que le descripteur est pret a nous delivrer un octet. Si nous desirons en 
lire plusieurs, l'appel read( ) peut etre bloquant. Si on bascule en lecture non bloquante, il faut 
de surcroit gerer un buffer interne pour recevoir assez d' informations avant de les traiter. 

Le fonctionnement des ecritures n'est pas plus sur : select( ) nous precise qu'on peut ecrire 
au moins un octet. Maintenant, si on veut transmettre une trame complete de donnees, il faut 
s'attendre a ce que write( )bloque indefiniment. L'ecriture non bloquante necessiterait 
d'etablir un tampon de sortie pour s'assurer que l'ensemble de donnees sera ecrit. 

Heureusement, on peut employer des procedures d' entrees-sorties totalement asynchrones 
nous epargnant la gestion d'un buffer. On programme une operation de lecture ou d'ecriture, 
le noyau la demarre, et lorsqu'elle est terminee le processus est averti par exemple par 
l'arrivee d'un signal. Durant le temps de l'operation d' entree-sortie, le programme est libre de 
faire ce que bon lui semble, utiliser le processeur, faire des appels-systeme, dormir. . . 

Une experience instructive consiste a lancer la commande 

$ find / -name introuvable 

tout en surveillant l'activite du processeur, par F intermediate de top ou de xload par 
exemple. Cette commande va parcourir toute l'arborescence du systeme de fichiers a la 
recherche des nceuds ayant le nom i ntrouvabl e. On observe que le disque est fortement mis a 
contribution, une activite incessante et prolongee s'y deroulant. Par contre, on remarque que 
le processeur lui-meme reste dans un etat calme, sa charge etant tres faible. Les procedures 
d' entree-sortie utilisent done tres peu de ressources de calcul de la machine. 

Dans une application temps-reel, il peut done etre tres interessant de deleguer une part du 
travail d'enregistrement par exemple, en le laissant s'executer automatiquement tandis que 
1' application peut continuer a repondre aux evenements survenant entre-temps. 

Les mecanismes d' entrees-sorties asynchrones sont disponibles si la constante POSIX 
ASYNCHR0N0US_I0 est definie dans <unistd.h>, ce qui est le cas depuis Linux 2.2. 

Jusqu'au noyau Linux 2.4 inclus, ces mecanismes sont en fait des fonctions de la bibliotheque 
C qui sont implementees au moyen des threads Posix. L edition des liens devait se faire avec 
la bibliotheque librt.so (real time) et la bibliotheque libpthread.so au moyen des options 
-1 rt -1 pthread en ligne de commande. 

Depuis le noyau 2.6, il s'agit veritablement de mecanismes asynchrones implemented par le 
noyau, seule Foption -1 rt reste necessaire. 

Le principe des entrees-sorties asynchrones conformes a la norme SUSv3 n'est guere plus 
complique que celui des entrees-sorties classiques : on prepare un bloc constitue par une 
structure aiocb, contenant en substance le buffer, le descripteur de fichier et le type d'opera- 
tion desiree. Ce bloc est transmis au noyau qui programme F entree-sortie, puis previent le 
processus par un signal lorsque l'operation est terminee. La structure aiocb comprend les 
membres suivants : 



Nom 


Type 


Signification 


aio_fildes 


int 


Descripteur du fichier concerne par l'operation d'entree-sortie. 


aio_offset 


off_t 


Emplacement au sein du fichier ou commence l'operation. 


aio_bjf 


void * 


Buffer pour les donnees a ecrire ou a lire. 
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Nom Type Signification 



ai o_ 


_nbytes 


size_t 


Nombre d'octets a transferer. 


ai o_ 


_reqpri o 


i nt 


Priorite de I'operation. 


aio_ 


_si gevent 


struct sigevent 


Description du mecanisme de signalisation une fois le transfert termine. 


ai o_ 


_1 io_opcode 


1 nt 


Code operatoire decrivant le transfert (uniquement dans certains cas). 



Pour programmer une lecture ou une ecriture, on emploie les fonctions aio_read( ) ou aio_ 
wrlteO, declarees ainsi dans <aio.h> : 

int aio_read (struct aiocb * aiocb); 
int aio_write (struct aiocb * aiocb); 

La structure ai ocb contient done le numero du descripteur de fichier, l'adresse du buffer pour 
les donnees et la taille desiree, mais egalement le decalage oil I'operation doit avoir lieu dans 
le fichier. Ce decalage est mesure en octets, comme avec 1 seek( ), depuis le debut du fichier. 
En effet, la position courante dans le fichier n'est jamais significative avec les entrees-sorties 
asynchrones. L' emplacement de lecture ou d'ecriture doit toujours etre indique. Nous revien- 
drons sur ce point ulterieurement. 

Le membre aio_reqprio dispose d'une valeur numerique indiquant la valeur qui doit etre 
soustraite de la priorite du processus pour executer I'operation d' entree-sortie. Ceci n'a 
d'interet que si on declenche de nombreuses operations simultanees. Plus cette valeur est 
elevee, moins I'operation sera prioritaire par rapport a ses consceurs. La priorite de I'opera- 
tion n'est que rarement utilisee, aussi la remplit-on generalement avec une valeur nulle. Nous 
en verrons toutefois un exemple d'utilisation plus tard. Avec les appels aio_read() et aio_ 
writeO, on n'emploie pas non plus le membre aio_l io„opcode puisque le systeme sait 
toujours quelle operation doit avoir lieu. 

Pour indiquer que le transfert asynchrone est termine - avec succes ou non -, le systeme peut 
nous envoyer un signal ou demarrer un thread sur une fonction speciale. Pour configurer ce 
comportement, on utilise la structure sigevent du champ a i o_s i gevent, definie dans <signal .h> 
ainsi : 



Nom Type Signification 



sigev_ 


.notify 


int 


Type de notification desiree pour indiquer la fin d'une 
operation asynchrone 


sigev_ 


_signo 


int 


Numero du signal a employer pour la notification 


sigev_ 


_val ue 


si gval_t 


Valeur a transmettre au gestionnaire de signaux ou 
au thread 


sigev_ 


_notify_f unction 


void (* f) (sigval_t) 


Fonction a declencher dans un nouveau thread 


sigev_ 


_noti fy_attri butes 


pthread_attr_t 


Attribut du nouveau thread 



Attention 

Les membres sigevjotify_function et si gev_notify_attri butes sont en realite des macros 
qui donnent acces aux champs d'une union assez complexe. On evitera done de nommer ainsi des variables. 
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Le type sigval_t est un autre nom de union sigval , que nous avons rencontree dans le 
chapitre 8, et qui peut prendre les formes suivantes : 





Nom 




Type 


si val_i nt 




i nt 




si val_ptr 




void * 





Le membre si gevjioti fy contient l'une des constantes symboliques suivantes : 

• SIGEV NONE : aucune notification n'est demandee. Le processus pourra toutefois s'assurer 
de la fin d'une operation en employant des routines que nous decrirons plus bas. 

• SIGEV_SIGNAL : le systeme enverra au processus le signal mentionne dans le champ si gev_ 
signo pour indiquer que l'operation est terminee. S'il s'agit d'un signal temps-reel 
Posix.lb, le gestionnaire recevra dans son argument siginfo_t des informations supple- 
mentaires, dont la valeur du membre si gev_val ue. Le champ si_code de la structure 
siginfo_t est rempli avec le code SLASYNCIO, comme nous l'avons deja evoque dans le 
chapitre 8. 

• SIGEV_THREAD : la bibliotheque C demarrera un nouveau thread, qui executera la fonction 
sur laquelle le champ si gevjioti fy_f uncti on represente un pointeur. Cette routine recevra 
en argument le contenu du membre si gev_val ue. Le thread cree recoit les attributs decrits 
par le champ si gevjioti fy_attributes. II s'agit des attributs au sens des Pthreads, comme 
nous les avons vus dans le chapitre 12 (detachable, joignable, etc.) 



Attention 

Avec Linux 2.6 la notification par un thread ne fonctionne pas au moment de la redaction de ces lignes 
(noyau 2.6.9). Le probleme est semble-t-il lie aux interactions avec la GlibC (2.3.2) et devrait etre corrige a 
I'avenir. 



Avec SIGEV_THREAD comme avec SIGEV_SIGNAL, on remplit generalement le membre s i v a 1 _ 
ptr du champ sigevj/alue avec un pointeur sur la structure aiocb elle-meme, afin que le 
nouveau thread ou le gestionnaire aient acces a l'operation realisee. Naturellement, on ne peut 
pas reemployer la meme structure avant que l'operation soit terminee. 

Pour savoir si une operation est terminee ou non, on utilise la fonction ai o_error( ) : 

int aio_error (const struct aiocb * aiocb); 

Cette routine renvoie l'erreur EINPROGRESS si l'operation decrite par la structure aiocb n'est 
pas terminee. Sinon elle transmet eventuellement un indicateur d'erreur. Une fois qu'une 
operation est finie, et uniquement a ce moment-la, on peut appeler la fonction aio_return( ) 
pour avoir le compte rendu de 1' entree-sortie : 

ssize_t aio_return (const struct aiocb * aiocb); 

Cette fonction renvoie tout simplement la valeur de retour des appels-systeme readO ou 
write ( ) sous-jacents. Cette fonction ne doit etre appelee qu'une seule fois car Posix.lb auto- 
rise une implementation oil elle servirait a liberer des donnees internes. 
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Meme dans le gestionnaire de signaux servant a la notification, il faut done employer toujours 
la sequence : 

if (aio_error(aiocb) == EINPROGRESS) 
return; 

if ((retour = aio_return(aiocb) ) != aiocb -> aio_nbytes) 
/* Traitement d'erreur */ 

else 

/* Reussite */ 

On peut tres bien eviter la notification et verifier plus tard explicitement si 1' operation s'est 
bien terminee. Dans le programme suivant nous allons utiliser trois lectures asynchrones, 
employant les trois possibilites de notification. La lecture demandee est la meme a chaque 
fois, on reclame les 256 premiers octets du fichier dont le nom est passe en argument. 

exemple_aio_read.c : 

#include <aio.h> 

#include <errno.h> 

#include <stdio.h> 

#include <signal .h> 

#include <unistd.h> 

#include <sys/stat.h> 

#define SIGNAL_I0 (SIGRTMIN + 3) 

void 

gestionnaire (int signum, siginfo_t * info, void * vide) 

{ 

struct aiocb * cb; 

ssize_t nb_octets; 

if (info->si_code == SI_ASYNCIO) { 

cb = info->si_val ue.sival_ptr; 

if (aio_error(cb) == EINPROGRESS) 
return; 

nb_octets = aio_return(cb) ; 

fprintf (stdout, "Lecture 1 : %d octets lus \n", nb_octets); 




void 

thread (sigval_t valeur) 
{ 

struct aiocb * cb; 
ssize_t nb_octets; 
cb = valeur. sival_ptr; 
if (aio_error(cb) == EINPROGRESS) 
return; 

nb_octets = aio_return(cb) ; 

fprintf (stdout, "Lecture 2 : %& octets lus \n", nb_octets); 

} 

int 

main (int argc, char * argv[]) 
{ 
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int fd; 

struct aiocb cb[3]; 

char buffer[256][3]; 

struct sigaction action; 

int nb_octets; 



if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s fichier \n", argv [0]); 
exit(EXIT_FAILURE); 



if ((fd = open(argv[l], 0_RD0N LY ) ) < 0) { 
perror( "open" ) ; 
exit(EXIT_FAILURE); 

} 

action. sa_sigaction = gestionnai re; 

action. sa_flags = SA_SIGINFO; 

sigemptyset(& action. sa_mask) ; 

if (sigaction(SIGNAL_IO, & action, NULL) < 0) { 

perrort "sigaction" ) ; 

exit(EXIT_FAILURE); 



cb[0] .aio_nbytes = 256; 
cb[0] .aio_reqprio = 0; 

cb[0] .aio_sigevent.sigev_notify = SIGEV_N0NE; 

/* Lecture 1 : Notification par signal */ 

cb[l].aio_fildes = fd; 

cb[l] .aio_offset = 0; 

cb[l].aio_buf = buffer [1]; 

cb[l] .aio_nbytes = 256; 

cb[l] .aio_reqprio = 0; 

cb[l] .aio_sigevent.sigev_notify = SIGEV_SIGNAL; 
cb[l] .aio_sigevent.sigev_signo = SIGNAL_I0; 
cb[l].aio_sigevent.sigev_value.sival_ptr = & cb[l]; 

/* Lecture 2 : Notification par thread */ 
cb[2].aio_fildes = fd; 
cb[2].aio_offset = 0; 
cb[2].aio_buf = buffer [2]; 
cb[2].aio_nbytes = 256; 
cb[2] .aio_reqprio = 0; 

cb[2].aio_sigevent.sigev_notify = SIGEV_THREAD; 
cb[2] .aio_sigevent. si gev_notify_f unction = thread; 
cb[2] .aio_sigevent.sigev_notify_attributes = NULL; 
cb[2] .aio_sigevent.sigev_val ue.sival_ptr = & cb[2]; 

/* Lancement des lectures */ 
if ((aio_read(& cb[0]) < 0) 



/* Lecture 0 : 
cb[0].aio_fildes 
cb[0] .aio_offset 
cb[0] .aio_buf 



Pas de notification */ 
= fd; 
= 0; 

= buffer [0]; 
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| | (aio_read(& cb[l]) < 0) 
| j (aio_read(& cb[2]) < 0)) { 

perror("aio_read") ; 

exi t( EXIT_FAI LURE) ; 

} 

fprintf (stdout, "Lectures lancees \n"); 
while ((aio_error(& cb[0]) == EINPROGRESS) 

|| (aio_error(& cb[l]) == EINPROGRESS) 

|| (aio_error(& cb[2]) == EINPROGRESS)) 

sleep(l) ; 
nb_octets = aio_return(& cb[0]); 

fprintf (stdout, "Lecture 0 : %d octets lus \n", nb_octets); 
return EXIT_SUCCESS; 

} 

La verification (aio_error(cb) == EINPROGRESS) est indispensable dans le gestionnaire de 
signaux, car SIGRTMIN+3 peut provenir d'une autre source. Au sein du thread ce controle est 
inutile car on ne doit normalement pas appeler cette routine directement. Je Fai laissee car 
c'est une bonne habitude - paranoiaque - pour s' assurer de la fin d'un transfert avant d' appeler 
ai o_return( ). 

En attendant que toutes les lectures soient terminees, le programme s'endort par periode 
d'une seconde - ou moins quand le signal arrive - pour eviter de consommer inutilement de 
ressources CPU. L' execution se deroule comme prevu : 

$ . /exemple_aio_read exemple_aio_read 

Lectures lancees 
Lecture 1 : 256 octets lus 
Lecture 2 : 256 octets lus 
Lecture 0 : 256 octets lus 
$ Is -1 Makefile 

-rw-r— r— 1 ccb ccb 242 Mar 2 14:02 Makefile 

$ ./exemple_aio_read Makefile 

Lectures lancees 
Lecture 1 : 242 octets lus 
Lecture 2 : 242 octets lus 
Lecture 0 : 242 octets lus 
$ 

Etant donne qu'une lecture ou une ecriture asynchrone modifie la position du pointeur dans le 
fichier, il faut considerer que cette valeur peut changer a tout moment tant que l'operation 
n'est pas terminee. Et a ce moment encore la position restera indeterminee tant qu'elle n'aura 
pas ete revalidee avec 1 seek( ). 

Cela signifie qu'il faut absolument eviter d' employer de lecture ou d' ecriture synchrones 
habituelles pendant que des operations asynchrones ont lieu. II faudrait en effet, dans le cours 
normal du processus, lier atomiquement le deplacement du pointeur avec 1 seek( ) et l'appel- 
systeme readO ou writeO qui suit. Ceci ne peut se faire qu'a Faide des appels-systeme 
pread( ) et pwrite( )', que nous avons examines dans le chapitre 19 et qui sont employes par 
la bibliotheque C pour implementer a i o_r e a d ( ) et a i o_w r i t e ( ) . 



1. Ces appels-systeme sont apparus dans Linux 2.2, ce qui explique pourquoi les entrees-sorties asynchrones n'etaient pas 
disponibles auparavant, meme si ce ne sont que des fonctions de bibliotheque. 
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Lorsque plusieurs operations simultanees doivent etre accomplies sur le meme fichier ou sur 
des fichiers differents, il est possible de programmer un ensemble d' entrees-sorties avec 1 i o_ 
1 istio( ) : 

int lio_listio (int mode, struct aiocb * liste_aiocb [], int nb_aiocb, 
struct sigevent * notification); 

Le premier argument est le mode de fonctionnement de 1 io_l i sti o( ). II peut prendre l'une 
des deux valeurs suivantes : 

• LI0_N0WAIT : la fonction lance toutes les operations decrites dans les arguments suivants de 
maniere asynchrone et se termine. Une fois que toutes les operations auront ete realisees, 
le processus recevra une notification decrite dans le dernier argument de 1 io_l istio( ). 
Naturellement, les notifications individuelles sont egalement recues au fur et a mesure de 
Faccomplissement des travaux. 

• LI0_WAIT : la fonction attend pour se terminer que toutes les operations soient finies. Ce 
mecanisme est surtout utilise avec une seule operation a la fois, pour realiser une lecture ou 
une ecriture normale, synchrone, alors que des operations asynchrones ont lieu sur le 
meme fichier. Le systeme preserve en effet Fatomicite du positionnement du pointeur et de 
F entree-sortie sur le fichier. 

Le second argument est un tableau de pointeurs sur des structures a i ocb. II y a done un niveau 
d' indirection supplementaire. Lavantage e'est qu'un pointeur NULL dans ce tableau est ignore. 
On peut done preparer une table avec de nombreuses operations et remplir le tableau de poin- 
teurs en ignorant facilement des operations qu'on ne souhaite pas effectuer immediatement. 
Le troisieme argument est le nombre d' operations dans le tableau. 

Dans chaque structure aiocb, il faut a present remplir le champ aio_l io_opcode avec l'une des 
valeurs suivantes : 

• LI0_READ : on veut faire une lecture. 

• LI0_WRITE : on veut une ecriture. 

• LIO NOP : pour ignorer 1' operation. 

Pour utiliser lio_listio() au lieu du lancement successif des trois lectures asynchrones de 
l'exemple precedent, on ajoute dans les variables de main( ) la structure sigevent et la table 

struct sigevent lio_sigev; 
struct aiocb * 1 io [3] ; 

puis on lance les lectures ainsi : 

/* Lancement des lectures */ 
lio[0] = & cb[0]; 
lio[l] = & cb[l] ; 
lio[2] = & cb[2] ; 

1 io_sigev.sigev_notify = SIGEV_NONE; 

if (lio_listio(LIO_NOWAIT, lio, 3, & lio_sigev) < 0) { 

perror( "1 io_l istio" ) ; 

exit(EXIT_FAILURE); 

} 
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Le deroulement du programme est identique a celui de exetnpl e_aio_read : 

$ ./exemple_lio_listio exemple_lio_listio 

Lectures lancees 
Lecture 1 : 256 octets lus 
Lecture 2 : 256 octets lus 
Lecture 0 : 256 octets lus 
$ 

Dans notre programme nous avons laisse le processus dans de courtes periodes de sommeil 
entre lesquelles nous avons examine l'etat des operations en cours. II existe une fonction plus 
adaptee a cette attente, nommee aio_suspend( ) : 

int aio_suspend (const struct aiocb * liste_aiocb [], int nb_aiocb, 
const struct timespec * del aijnaxi ) ; 

Cette routine prend en argument un tableau de pointeurs sur des structures aiocb, comme le 
faisait lio_listio(), et attend que l'une au moins des operations du tableau se termine. Elle 
rend alors la main au processus. On peut ensuite examiner, avec aio_error( ) , quelle opera- 
tion s'est achevee et verifier son code de retour avec aio_return( ). L' operation terminee peut 
etre supprimee de la liste d' attente en remplacant son pointeur par NULL. 

On peut ainsi eviter les notifications par 1' intermediate d'un gestionnaire de signaux impli- 
quant un changement de contexte du processus. Le programme ci-dessous emploie ce prin- 
cipe et n'utilise ni gestionnaire de signaux ni thread supplementaire. 

Si aio_suspend( ) est interrompue par un signal, elle echoue avec l'erreur EINTR. Ce cas peut 
etre tout a fait normal s'il s'agit du signal notifiant la fin d'une operation. Le dernier argument 
est un delai d'attente maximal. Si rien ne s'est produit durant ce temps, la fonction echoue 
avec l'erreur EAGAIN. Dans le programme suivant, nous n'employons pas de delai, aussi ce 
pointeur est-il NULL. 

exemple_aio_suspend.c : 

#include <aio.h> 

#include <errno.h> 

#include <stdio.h> 

#include <sys/stat.h> 

#define NB_0P 10 

int 

main (int argc, char * argv[]) 
{ 

int fd; 

int i; 

struct aiocb cb[NB_0P]; 

char buffer[256][NB_0P]; 

struct sigevent lio_sigev; 
struct aiocb * lio[NB_0P]; 

if (argc != 2) { 

fprintf (stderr, "Syntaxe : %s fichier \n", argv[0]); 
exit(EXIT_FAILURE); 
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} 

if ((fd = open(argv[l], CLRDONLY) ) < 0) { 
perror( "open" ) ; 
exit(EXIT_FAILURE); 

} 

for (i =0; i < NB_0P; i ++) { 
cb[i].aio_fildes = fd; 
cb[i].aio_offset = 0; 
cb[i].aio_buf = buffer[i]; 
cb[i ] .aio_nbytes = 256; 
cb[i].aio_reqprio = i; 
cb[i ] .aio_l io_opcode = LI0_READ; 
cb[i].aio_sigevent . sigev_notify = SIGEV_N0NE; 
Ho[1]= & cbCi] ; 

} 

1 io_sigev.sigev_notify = SIGEV_N0NE; 

if (lio_listio(LI0_N0WAIT, lio, NB_0P, & lio_sigev) < 0) { 
perror( "1 io_l istio" ) ; 
exit(EXIT_FAILURE); 

} 

fprintf (stdout, "Lectures lancees \n"); 

while (1) { 

/* Reste-t-il des operations en cours */ 
for (i = 0; i < NB_0P; i ++) 
if ClioCi] ! = NULL) 
break; 
if (i == NB_0P) 

/* Toutes les operations sont finies */ 
break; 

if (aio_suspend(lio, NB_0P, NULL) == 0) { 
for (i = 0; i < NB_0P; i ++) 
if (lio[i] ! = NULL) 

if (aio_error(lio[i]) != EINPROGRESS) { 

fprintf (stdout, "Lecture %d : %d octets \n", 
i, aio_return(l io[i ] ) ) ; 

/* fini... */ 
lio[i] = NULL; 

} 

} 

} 

return EXIT_SUCCESS; 

} 

Nous lancons dix lectures simultanees ; nous obtenons : 

$ ./exemple_«io_suspend exemple_aio_read 

Lectures lancees 
Lecture 0 : 256 octets 
Lecture 1 : 256 octets 
Lecture 2 : 256 octets 
Lecture 3 : 256 octets 
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Lecture 4 : 256 octets 
Lecture 5 : 256 octets 
Lecture 6 : 256 octets 
Lecture 7 : 256 octets 
Lecture 8 : 256 octets 
Lecture 9 : 256 octets 
$ 

Mentionnons enfin l'existence d'une fonction aio_cancel ( ) permettant fheoriquement 
d'annuler une operation qui n'a pas encore eu lieu. 

int aio_cancel (int fd, struct aiocb * aiocb); 

Cette routine tente d'annuler 1' operation indiquee en second argument sur le descripteur de 
fichier fourni en premiere position. Si le pointeur aiocb est NULL, cette fonction tente 
d'annuler toutes les operations ayant lieu sur le descripteur indique. 

La routine ai o_cancel ( ) ne donnant aucune garantie de reussite et ne permettant pas de savoir 
si l'operation a reellement ete annulee, elle n'a quasiment aucune utilite. 

Ecritures synchronisees 

Les mecanismes d' entree-sortie avances, tels que ceux qui sont decrits par la norme SUSv3, 
introduisent un concept d' ecritures synchronisees, qui ne doivent pas etre confondues avec les 
ecritures synchrones ou asynchrones. En fait, il est tout a fait possible d' employer des ecri- 
tures asynchrones synchronisees. 

La notion d'ecriture synchronised fait reference au transfert effectif des donnees vers le 
disque. Nous avons deja observe dans le chapitre 18 que des informations ecrites dans un flux 
traversaient trois niveaux de buffers successifs (voir figure 18.1). Ici, nous travaillons directe- 
ment avec le descripteur de fichier et nous ignorons done le premier buffer associe au flux 1 . 
Nous ne pouvons pas controler non plus la zone tampon integree dans le lecteur de disque, 
mais nous allons nous interesser a la memoire cache geree par le noyau. 

II peut etre utile dans certaines applications temps-reel, dans des systemes de gestion de bases 
de donnees ou dans des logiciels d'enregistrement de type « boite noire », de pouvoir passer 
outre la memoire cache du noyau et s' assurer que les donnees ecrites par un appel-systeme 
write ( ) ont bien ete transmises au controleur de peripherique, a defaut du support physique 
reel. Ceci peut etre realise avec plusieurs degres de precision. 

Tout d'abord rappelons que F appel-systeme fsyncO, decrit dans le chapitre 19, sert a 
synchroniser le contenu du fichier sur lequel on lui passe un descripteur. Cette routine attend 
que toutes les donnees ecrites soient effectivement transmises au controleur de disque, puis 
elle revient en renvoyant zero si tout s'est bien passe, ou -1 sinon. Dans le cas d'un echec de 
synchronisation, l'erreur EIO est renvoyee dans errno. 

II existe egalement un appel-systeme sync( ) qui ne prend pas d' argument et renvoie toujours 
zero. Ici, toutes les ecritures en attente dans la memoire cache du noyau sont realisees avant le 
retour. Comme nous l'avons precise dans le chapitre 18, il existe un utilitaire /bin/sync qui 



1 . Les methodes d' ecritures synchronisees etudiees ici sont appliquees la plupart du temps directement aux descripteurs pour des 
raisons d'efficacite. Si toutefois 1'utilisation d'un flux est indispensable, on pourra se tourner vers f f 1 ush( ) ou setvbuf ( ), que 
nous avons rencontrees dans le chapitre 18. 
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invoque cet appel-systeme. Sur les premieres versions de Linux, les ecritures pouvaient rester 
en suspens indefiniment tant que la memoire cache n'etait pas pleine et qu'on n'invoquait pas 
sync( ). Pour cela, l'utilitaire /bin/sync etait appele regulierement par une commande de la 
table crond. A present, ce n'est plus necessaire, un demon particulier nomme kflushd est 
charge de ce role. II est cree directement par le noyau au moment du demarrage (juste apres le 
lancement de init). 

L' utilisation de fsync( ) peut parfois etre suffisante dans une application, car elle permet de 
creer des points ou on connait l'etat du fichier. Le vidage de la memoire tampon est quand 
meme assez couteux, d'autant qu'il faut mettre a jour non seulement les donnees proprement 
dites, mais egalement des informations de controle qui ne sont pas necessairement indispen- 
sables, comme la date de modification de Fi-nceud. Pour cela, Posix.lb a introduit l'appel- 
systeme fdatasyncO, disponible si la constante POSIX SYNCHRONIZED 10 est definie dans 
<uni std.h> : 

int fdatasync (int descripteur) ; 

Cette routine se comporte comme f sync( ) au niveau de l'application, mais elle n'ecrit reelle- 
ment que les donnees indispensables, en laissant les autres dans la memoire cache du noyau. 
En cas d' arret brutal du systeme, l'etat du disque est tel que les informations pourront etre 
recuperees, eventuellement apres le passage d'un utilitaire de reparation comme /sbin/ 
fsck.ext3. 

Si toutes les ecritures dans un fichier doivent etre considerees de la meme maniere, il est 
agacant de devoir invoquer fsync( ) ou fdatasync( ) apres chaque write( ). Pour eviter cette 
manipulation, nous pouvons configurer directement le comportement de toutes les ecritures 
grace a F appel-systeme open( ). Lattribut 0_SYNC ajoute lors de l'ouverture d'un descripteur 
signifie que toutes les ecritures seront synchronisees, comme si on invoquait fsync( ) imme- 
diatement apres. 



Note 

Le noyau Linux n'autorise pas la modification de I'attribut 0_SYNC d'un fichier apres son ouverture, contraire- 
ment a d'autres systemes qui le permettent avec fcntl ( ).Ceci peut d'ailleurs poser des problemes lorsque 
le descripteur a ete herite du processus pere. 



II existe deux autres constantes differentes tolerees lors de l'ouverture d'un descripteur, bien 
qu'elles aient pour l'instant exactement la meme signification que 0_SYNC : 

Norn Signification 

0_DSYNC Pour ne synchroniser automatiquement que les donnees ecrites dans le descripteur, sans se soucier 
des informations relatives a I'i-naeud. C'est I'equivalent d'une fdatasynct ) apres chaque write( ). 

0_RSYNC Lors d'un readO, le noyau doit mettre a jour I'heure de derniere lecture de I'i-nceud. Avec cette 
constante, cette mise a jour sera synchronisee. Lorsque read( ) se termine, I'i-nceud a ete mis a jour. 
Ce mecanisme est rarement utile. 

Comme nous l'avons deja indique, les ecritures synchronisees peuvent egalement se faire de 
maniere asynchrone. Lorsque la notification sera envoyee au processus, les donnees ecrites 



Entrees-sorties avancees 

Chapitre 30 



auront ete entierement transferees sous la houlette du controleur de peripherique. Cela se fait 
en utilisant 0_SYNC lors de l'ouverture du descripteur. 

Pour obtenir F equivalent asynchrone des fonctions fsyncO et fdatasyncO, c'est-a-dire la 
garantie ponctuelle de vidage de la memoire cache, on emploie la fonction aio_fsync(), 
declaree ainsi : 

int aio_fsync (int mode, struct aiocb * aiocb); 

Cette routine declenche fsyncO - de maniere asynchrone- sur le descripteur aiocb. aio_ 
f i 1 des si son premier argument vaut 0_SYNC, ou simplement fdatasynct ) s'il s'agit de CLDSYNC. 
Lorsque la synchronisation est terminee, la notification inscrite dans aiocb. aio_sigevent est 
declenchee. II faut bien comprendre que la routine ai o_f sync( ) n'attend pas la fin du vidage 
de la memoire cache. Si on desire obtenir ce comportement, il faut appeler directement 
f sync( ). 

Les ecritures synchronisers sont evidemment tres couteuses en temps d' execution. Le 
programme suivant va en faire la demonstration : il cree un fichier dans lequel il ecrit 
256 x 1 024 blocs de 256 octets. Suivant la valeur du second argument sur la ligne de com- 
mande, les ecritures seront synchronisees ou pas. 

exemple_osync.c : 

#include <fcntl .h> 
#include <stdio.h> 
#include <unistd.h> 

int 

main (int argc, char * argv []) 

{ 

int fd; 

char buffer[256]; 
int i , j ; 



if (argc != 3) { 

fprintf (stderr, "Syntaxe : %s fichier sync \n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

if C(argv[2][0] == 'o') || (argv[2][0] == '0')) { 
fprintf (stdout, "Ecritures synchronisees \n"); 
if ((fd = open(argv[l], 0_RDWR | 0_CREAT | 0_SYNC, 0644)) < 0) { 
perror( "open" ) ; 
exi t(EXIT_ FAILURE); 

} 

} else { 

fprintf (stdout, "Ecritures non synchronisees \n"); 

if ((fd = open(argv[l], 0_RDWR | 0_CREAT, 0644)) < 0) { 

perror( "open" ) ; 

exi t(EXIT_ FAILURE); 

} 

} 

for (i = 0; i < 1024; i ++) 
for (j - 0; j < 256; j ++) 

if (write(fd, buffer, 256) < 0) { 
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perrorCwrite") ; 
exit(EXIT_FAILURE); 

} 

fsync(fd) ; 
close(fd); 

return EXIT_SUCCESS; 

} 

L'appel f sync( ) final nous permet d'etre sur que toutes les ecritures ont eu lieu au moment de 
la fin du programme. Sinon des transferts continueraient a se produire alors que nous serions 
deja revenus au shell, faussant ainsi les resultats. 

Pour avoir des statistiques d'execution assez precises, on pourrait utiliser la commande time 
du shell et invoquer le programme plusieurs fois afin d'obtenir des valeurs moyennes. Les 
differences sont telles qu'il n'y a meme pas besoin d'utiliser une surveillance si precise. II 
suffit d'encadrer l'appel au programme par des commandes date pour connaitre sa duree : 

$ date ; ./exemple_osync essai.sync 0 ; date 

lun mar 6 14:09:54 CET 2000 

Ecritures synchronisers 

lun mar 6 14:23:26 CET 2000 

$ date ; ./exemple_osync essai.sync N ; date 

lun mar 6 14:23:30 CET 2000 
Ecritures non synchronisees 
lun mar 6 14:23:54 CET 2000 
$ rm essai .sync 
$ 

24 secondes dans un cas, contre pres de 14 minutes dans F autre ! 

La difference est aussi importante car nous avons demande de nombreuses ecritures succes- 
sives de blocs de petite taille. L'i-nceud du fichier doit done etre mis a jour pour chaque ecri- 
ture (taille du fichier, heure de derniere modification...). Lors d'ecritures non synchronisees, 
cet i-nceud reste en memoire entre chaque modification. II n'est ecrit sur le disque qu'a une ou 
deux reprises - a cause du demon pdf 1 ush entre autres. De meme, chaque bloc disque (1 Ko) 
est touche successivement par quatre ecritures de 256 octets, et on gagne largement a le 
garder en memoire le plus longtemps possible. 

On restreindra done l'utilisation des ecritures synchronisees aux applications qui en ont reel- 
lement besoin, avec des contraintes importantes en tolerance de panne. Dans la plupart des 
cas, un simple appel a fsync( ) en des points-cles du logiciel suffira pour les besoins de fiabi- 
lite, tout en conservant un bon temps de reponse a l'application. Rappelons que l'ecriture 
synchronised garantit uniquement que les donnees sont parvenues au controleur de disque, 
mais pas qu'elles sont effectivement ecrites sur le support physique. Si ce point devient 
critique - comme dans un systeme d'enregistrement embarque -, il faudra choisir avec soin le 
materiel utilise afin de minimiser la latence des ecritures effectives. 

Conclusion 

Nous avons examine ici plusieurs methodes permettant d'ameliorer les entrees-sorties d'un 
processus, dans le but de rendre les ecritures plus fiables (synchronisees) ou de rendre le fil 
d'execution principal du programme independant des evenements survenant sur les descrip- 
teurs (multiplexage et entrees-sorties asynchrones). 
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Les mecanismes de multiplexage sont bien entendu applicables sur les tubes de communica- 
tion, mais ils sont le plus frequemment utilises avec les sockets, qui sont une extension de ces 
tubes a l'echelle d'un reseau. Les prochains chapitres vont developper les concepts et les prin- 
cipes mis en ceuvre dans ce type de logiciel. 
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Nous allons essayer dans ce chapitre de mettre en place les bases de la programmation reseau 
sous Linux, principalement en ce qui concerne la determination des adresses et des numeros 
de ports, ainsi que la manipulation de Fensemble de ces donnees. 

L'essentiel du travail dans la programmation reseau revient en effet a determiner comment 
joindre le correspondant. La communication elle-meme ne differe pas beaucoup des methodes 
observees dans le chapitre 28 avec les tubes. Ceci sera aborde dans le chapitre suivant, par 
F intermediate de l'interface proposee par les sockets BSD. 

Reseaux et couches de communication 

Le but de notre etude est de permettre la mise au point d' applications pouvant recevoir ou 
envoyer des informations, en dialoguant avec des correspondants se trouvant n'importe ou 
dans le monde, a partir du moment ou une connectivite reseau a ete etablie. 

On represente communement les fonctionnalites reseau par une serie de couches successives 
de communication. Ce modele est interessant car il permet de bien distinguer la maniere dont 
les differents protocoles sont lies. Chaque couche ne peut dialoguer directement qu'avec la 
couche superieure ou inferieure, seule la couche physique peut mettre en relation les diffe- 
rentes stations. Un exemple de stratification reseau est presente dans la figure 31.1. 

Lorsqu'une application desire envoyer des informations a une autre application se deroulant 
sur un ordinateur distant, elle prepare un paquet de donnees qu'elle transmet a la couche de 
transport (TCP sur ce schema). Celle-ci encadre les donnees avec ses propres informations - 
en l'occurrence des champs servant a s'assurer de Fintegrite du message transmis - puis 
passe le paquet a la couche reseau, IP. Cette derniere encadre a nouveau le paquet par des 
informations permettant le routage dans le reseau et passe le relais a la couche de liaison, 
Ethernet. A ce niveau, les dernieres informations ajoutees permettent d'identifier la carte 
reseau de l'ordinateur cible. Le niveau materiel assure la transmission electrique des donnees. 
A l'arrivee, le processus inverse se deroule, chaque couche supprime les elements qui lui 
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etaient propres et donne le paquet restant a la couche superieure. Finalement, la couche appli- 
cative recoit les donnees qui lui etaient destinees. On peut done considerer que chaque couche 
dialogue virtuellement avec la couche correspondante sur l'ordinateur cible, bien qu'elle n'ait 
de veritable contact qu'avec ses couches superieure et inferieure. 

Les noms des differentes couches sont derives d'un document de 1984 nomme modele OSI 
(Open Systems Interconnection), qui sert a representer les communications reseau avec sept 
niveaux successifs. Malheureusement les protocoles les plus repandus, TCP/IP et UDP/IP, ne 
sont pas fondes sur ce modele et n'emploient que cinq niveaux, comme on le voit sur la 
figure. Les termes ont ete conserves par habitude, mais ils ne conviennent pas tout a fait. 



Figure 31.1 
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de communication 
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Couche reseau 
protocole IP 




Couche reseau 
protocole IP 




Couche de liaison 
Ethernet 


Couche de liaison 
Ethernet 





Couche physique 
Support materiel 

Le support physique permettant de relier des stations peut prendre des formes diverses. Les 
plus communes sont les interfaces Ethernet, avec une liaison en cable fin (prise BNC) ou en 
paires torsadees (prise RJ45), et les liaisons modems. Entre deux stations donnees peuvent 
se trouver de nombreux elements, comme des repeteurs qui assurent la prolongation d'un 
brin physique, des passerelles qui permettent 1' interconnexion de reseaux differents, ou des 
routeurs qui servent a orienter les donnees entre plusieurs sous-reseaux. Sur un reseau, les 
machines sont identifiees de maniere unique. Les cartes Ethernet - qui composent la couche 
de liaison - comportent par exemple un identificateur numerique sur 48 bits, appele adresse 
MAC (Medium Access Control), dont l'unicite est assuree par le fabricant de la carte. Cette 
valeur peut etre examinee a l'aide de l'utilitaire /sbi n/i f conf i g par exemple : 

$ /sbin/ifconfig ethO 

ethO Lien encap: Ethernet HWaddr 00:50:04:8C:82:5E 

inet adr:172.16.1.51 Beast : 172 . 16. 1 .255 Masque:255. 255. 255.0 

UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:l 

Paquets Recus:117 erreurs:0 jetes:0 debordements:0 trames:0 

Paquets transmis:66 erreurs:0 jetes:0 debordements:0 carrienO 

col 1 i si ons : 0 Ig file transmission:100 

Interruption^ Adresse de base:0x200 

$ 

L identificateur MAC (00:50:04:8C:82:5E en l'occurrence) est indique dans la rubrique 
Hardware Address . Une machine est capable, grace a son adresse, de reconnaitre si un bloc de 
donnees lui est destine et de le transmettre aux protocoles de dialogue se trouvant au-dessus. 
On trouvera au besoin plus de renseignements dans [Ferrero 1993] Les reseaux Ethernet. 
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Plusieurs protocoles peuvent etre employes pour transmettre des informations au-dessus de 
cette couche de liaison, mais Fessentiel des communications au niveau applicatif se fait en 
employant IP {Internet Protocol). Le protocole IP permet d'envoyer un paquet de donnees a 
destination d'un hote particulier, en Fidentifiant a l'aide d'une adresse sur 4 octets. Celle-ci 
est presque toujours representee avec la notation dite « pointee », c'est-a-dire en ecrivant les 
valeurs decimales des octets separees par des points. Dans l'exemple precedent, /sbin/ 
i f conf i g affichait l'adresse IP de l'interface ethO (172.16. 1 . 51) avec le titre Internet Address . 
Le protocole actuel IP version 4 sera remplace dans l'avenir par IP version 6 (il n'existe pas 
de version 5), aussi appele IPng (IP Next Generation), mais le support dans le noyau Linux 
est encore experimental et incomplet. 

Au niveau du protocole IP, les donnees peuvent etre routees. La communication n'est plus 
limitee aux machines se trouvant sur le meme reseau materiel 1 . Au contraire, il existe des 
passerelles permettant de transferer les paquets d'un reseau vers un autre. La figure 31.2 
montre un exemple de reseaux relies entre eux. Chaque machine peut dialoguer avec toutes 
les autres, par le biais de la couche IP. 



Figure 31 .2 

Exemple de passerelles 
entre reseaux 



172.16.1.51 
Station 1 



172.16.1.1 
Station 2 
172.4.1.1 



172.4.1.20 
Station 3 



Internet 



172.4.1.21 
Station 4 
195.32.208.117 



Modem , 



195.101.148.65 
F.A.I. 



Par exemple le noyau de la station 1 sait, grace a ses tables de routage configurees avec l'uti- 
litaire /sbin/route, que pour atteindre une machine ne se trouvant pas directement sur son 
brin Ethernet, par exemple la station 3, il doit demander le relais a la station 2. Les paquets 
transmis a la couche de liaison seront done diriges vers l'adresse MAC de cette machine 2. 



1. La mise en correspondance entre l'adresse IP et l'adresse MAC se fait par 1' intermediate d'un protocole norame ARP 
(Address Resolution Protocol) sortant du cadre de notre propos. 
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Par contre, l'adresse IP du destinataire sera celle de la station 3. La couche de liaison 
s'occupe uniquement de l'adresse Ethernet et pas de l'adresse IP. 

La station 2 dispose de deux cartes Ethernet. Son noyau est configure grace a /sbin/ipfwadm 
pour laisser passer les paquets d'un reseau a l'autre. Lorsqu'un bloc de donnees arrive sur une 
carte reseau a destination d'un autre sous-reseau, celle-ci assure le transfert d'une interface a 
l'autre. 

La station 3 sait que pour acceder aux machines dont l'adresse IP commence par 172 . 16, elle 
doit s'adresser egalement a la station 2. Quant a la station 4, elle sert a joindre un fournisseur 
d'acces Internet. Elle sert aussi de passerelle, mais comme les machines des reseaux 172 . 16 et 
172.4 ne sont pas connues directement sur Internet, la configuration est legerement plus 
compliquee car il faut employer un mecanisme de Masquerading IP. On trouvera des rensei- 
gnements sur toutes ces notions de routage dans [Kirch 2001] L' administration reseau sous 
Linux, et dans les documents NET-3-HOWTO et IP-Masquerade mini-HOWTO . 

Lorsqu'on utilise une connexion avec le protocole PPP {Point to Point Protocol), comme c'est 
le cas avec la majorite des fournisseurs d'acces a Internet, il n'y a pas vraiment de distinction 
entre la couche reseau et la couche de liaison, qui sont regroupees dans PPP. 

Ce qu'on retiendra ici, c'est que le protocole IP est capable d'envoyer un paquet de donnees a 
destination d'un hote precis, dont l'adresse est indiquee par 4 octets, en franchissant les 
elements de routage. 

L utilisation directe du protocole IP est plutot rare au niveau d'une application. On peut 
1' employer pour envoyer des messages de commande appartenant au protocole ICMP 
(Internet Control Message Protocol ), comme les demandes d'echo emises par l'utilitaire 
pi ng. Neanmoins, la plupart du temps on fera appel a une couche superieure. Nous etudierons 
ici les deux protocoles TCP {Transmission Control Protocol) et UDP (User Datagram 
Protocol), qui ont des roles complementaires. 

Le protocole TCP sert a fiabiliser la communication entre deux hotes. Pour cela, il assure les 
fonctionnalites suivantes : 

• Connexion. Avec ce protocole, une liaison s'etablit par une concertation de l'emetteur et 
du recepteur. On dit que la communication s'effectue de maniere connectee. Une fois le 
canal de communication etabli, il reste en vigueur jusqu'a ce qu'on le referme. 

• Fiabilite. Le protocole TCP garantit que - tant que la connexion sera valide - les donnees 
qui y transitent arriveront dans l'ordre et que leur integrite sera verifiee. 

• Controle de flux. En complement de la fiabilite du protocole TCP, il est possible de 
F employer comme un flux d' octets, a la maniere d'un tube de communication. L'ecriture 
peut devenir bloquante si le recepteur ne lit pas suffisamment vite de son cote. 

A l'oppose, le protocole UDP fournit un service de transmission de paquets (datagram) sans 
assurer de fiabilite : 

• Pas de connexion. L'emetteur peut envoyer des donnees sans s'assurer qu'un processus est 
a l'ecoute. Aucun acquittement n'est necessaire. 

• Pas de fiabilite. Le paquet transmis ne contient qu'optionnellement une somme de 
controle. Si des donnees sont perdues ou erronees, elles ne sont pas repetees. 

• Transmission en paquets. Les donnees envoyees n'arrivent pas necessairement dans le 
meme ordre qu'au depart. 
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En fait, le protocole IP brut offre les memes fonctionnalites que UDP, a la somme de controle 
pres, qui n'existe pas dans la couche reseau (en fait IP verifie l'integrite de ses propres infor- 
mations mais pas celles des donnees du paquet). L' implementation de TCP effectue done de 
nombreuses taches afin d' assurer un mecanisme de communication fiable. Entre autres, TCP 
verifie l'etat des paquets qui arrivent, s'assure qu'ils sont dans le bon ordre au moyen d'un 
numero de sequence, gere un delai maximal de transmission, des acquittements, etc. Si un 
paquet est endommage ou absent, la couche TCP du destinataire demande a la couche TCP de 
Femetteur de renvoyer les donnees. Tout ceci offre done une securite de transmission des 
informations mais au prix d'une charge reseau supplementaire. 

Le protocole UDP de son cote permet d'envoyer des paquets de donnees sans se soucier vrai- 
ment du recepteur. Ceci est particulierement utile dans les applications qui veulent diffuser 
des informations sous forme de fonctionnalite annexe du logiciel. II n'est pas question dans ce 
cas de perdre du temps a gerer les connexions des correspondants ni de risquer de rester 
bloque si le recepteur ne lit pas assez vite. L'emetteur peut envoyer ses paquets de donnees et 
passer immediatement a autre chose, il est de la responsabilite du recepteur d'etre a l'ecoute 
au bon moment. 



Protocoles 

Les protocoles connus par le systeme dependent des options de compilation du noyau. 
Toutefois, un certain nombre d'entre eux sont definis dans un fichier systeme nomme /etc/ 
protocol s. 

$ cat /etc/protocols 

# /etc/protocols: 



ip 


0 


IP 


# 


internet protocol, pseudo protocol 


i cmp 


1 


ICMP 


# 


internet control message protocol 


igmp 


2 


IGMP 


# 


Internet Group Management 


ggp 


3 


GGP 


# 


gateway-gateway protocol 


i pencap 


4 


IP-ENCAP 


f 


IP encapsulated in IP (officially 


St 


5 


ST 


f 


ST datagram mode 


tcp 


6 


TCP 


f 


transmission control protocol 


egp 


8 


EGP 


f 


exterior gateway protocol 


pup 


12 


PUP 


# 


PARC universal packet protocol 


udp 


17 


UDP 


# 


user datagram protocol 


hmp 


20 


HMP 




host monitoring protocol 


xns-idp 


22 


XNS-IDP 


# 


Xerox NS IDP 


rdp 


27 


RDP 


# 


"reliable datagram" protocol 


i so-tp4 


29 


IS0-TP4 


# 


ISO Transport Protocol class 4 


xtp 


36 


XTP 


f 


Xpress Tranfer Protocol 


ddp 


37 


DDP 


f 


Datagram Delivery Protocol 


idpr-cmtp 39 


IDPR-CMTP 


# 


IDPR Control Message Transport 


rspf 


73 


RSPF 


#Radio Shortest Path First. 


vmtp 


81 


VMTP 


# Versatile Message Transport 


ospf 


89 


OSPFIGP 


# Open Shortest Path First IGP 


ipip 


94 


IPIP 


# 


Yet Another IP encapsulation 


encap 


98 


ENCAP 


# Yet Another IP encapsulation 



$ 
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A chaque protocole est associe un numero d'identification standard, employe pour la commu- 
nication reseau. Ces numeros ne nous interessent pas ici. L'important pour nous est de 
connaitre l'orthographe connue par le systeme pour les noms des protocoles qui nous concer- 
ned, c'est-a-dire UDP, TCP, IP, eventuellement RDP et ICMP 

Pour analyser ce fichier, la bibliotheque met a notre disposition plusieurs fonctions. Tout 
d'abord getprotobyname( ) permet de rechercher un protocole a partir d'une chaine represen- 
tant son nom, alors que getprotobynumber( ) effectue le meme travail a partir du numero du 
protocole. Ces fonctions sont declarees dans <netdb.h>. Ce fichier d'en-tete contient une 
declaration qui declenche un avertissement du compilateur si on laisse Foption -pedanti c. On 
peut ignorer cet avertissement ou supprimer cette option dans le fichier Ma kef i 1 e. 

struct protoent * getprotobyname (const char * nom); 
struct protoent * getprotobynumber (int numero); 

La structure protoent contient les membres suivants : 



Nom 


Type 


Signification 


p_name 


char * 


Nom officiel du protocole (defini par la RFC 1700). 


p_proto 


int 


Numero officiel du protocole (dans I'ordre des octets de la machine). 


p_al iases 


char ** 


Table de chaines de caracteres correspondant a d'eventuels alias. Cette table est 
terminee par un pointeur NULL. 



Nous avons indique que le numero de protocole est fourni dans I'ordre des octets de la 
machine. Nous detaillerons ceci plus loin. 

L' utilisation de ces routines est assez evidente. Le programme suivant affiche les informations 
concernant les protocoles indiques sur la ligne de commande. 

exemple_getprotoby.c : 

#include <netdb.h> 
#include <stdio.h> 

int 

main (int argc, char * argv[]) 
{ 

int i , j ; 

int numero; 
struct protoent * proto; 

for (i =1; i < argc; i ++) { 

if (sscanf(argv[i], "%d", & numero) == 1) 
proto = getprotobynumber(numero) ; 

el se 

proto = getprotobyname(argv[i]) ; 
fprintf (stdout, "%s : ", argv[i]); 
if (proto == NULL) { 

fprintf (stdout, "inconnu \n"); 

continue; 

} 
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fprintf (stdout, "%s ( ", proto->p_name) ; 

for (j = 0; proto->p_aliases[j] != NULL; j ++) 

fprintf (stdout, "Is ", proto->p_aliases[j]); 
fprintf (stdout, ") numero = %d \n", proto->p_proto) ; 

} 

return EXIT_SUCCESS; 

} 

Nous pouvons rechercher quelques protocoles, en verifiant que la distinction entre majuscules 
et minuscules se fait. 

$ ./exemple_getprotoby tcp 1 

tcp : tcp ( TCP ) numero = 6 

1 : icmp ( I CMP ) numero = 1 

$ ./exemple_getprotoby udp 17 UDP UdP 

udp : udp ( UDP ) numero = 17 

17 : udp ( UDP ) numero = 17 

UDP : udp ( UDP ) numero = 17 

UdP : inconnu 



Si on desire balayer tous les protocoles connus - par exemple pour comparer les noms avec 
strcasecmpO afin d'autoriser des saisies comme UdP-, on peut employer les routines 
setprotoent( ), getprotoent( ) et endprotoent( ). La premiere ouvre le fichier des protocoles, 
la seconde y lit l'enregistrement suivant, et la derniere referme ce fichier. 



Si 1' argument passe a setprotoent( ) n'est pas nul, les appels eventuels a getprotobyname( ) 
ou getprotobynumber( ) ne refermeront pas le fichier apres 1' avoir consulte. Sinon, la lecture 
reprendra au debut du fichier. 

Le programme suivant affiche le nom de tous les protocoles connus par le systeme : 
exemple_getprotoent.c : 

#include <stdio.h> 
#include <netdb.h> 

int 
main (void) 

{ 

struct protoent * proto; 
setprotoent(O) ; 

while ((proto = getprotoent( ) ) != NULL) 

fprintf (stdout, "%s ", proto->p_name) ; 
endprotoentt ) ; 
fprintf (stdout, "\n"); 
return EXIT_SUCCESS; 

} 



$ 



void setprotoent (int ouvert); 

struct protoent * getprotoent (void); 
void endprotoent (void); 
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L' execution donne : 

$ ./exemple_getprotoent 

ip icmp igmp ggp ipencap st tcp egp pup udp hmp xns-idp rdp iso-tp4 xtp ddp 
idpr-cmtp rspf vmtp ospf ipip encap 

$ 

Les routines que nous avons vues ici renvoient leurs donnees dans des zones de memoire 
statiques. Ceci peut poser un probleme dans un programme multithread, aussi existe-t-il des 
extensions Gnu reentrantes. 

int getprotobynumber_r (int numero, 

struct protoent * protocole, 

char * buffer, size_t taille_buffer, 

struct protoent ** retour); 
int getprotobyname_r (const char * nom, 

struct protoent * protocole, 

char * buffer, size_t taille_buffer, 

struct protoent ** retour); 
int getprotoent_r (struct protoent * protocole, 

char * buffer, size_t taille_buffer, 

struct protoent ** retour); 

Ces routines sont un peu plus compliquees puisqu'il faut leur transmettre un buffer dans 
lequel elles inscriront les chaines de caracteres sur lesquelles la structure protoent contient 
des pointeurs. Nous avons deja rencontre ce principe dans le chapitre 26, avec diverses 
routines comme getgrnam_r( ). 



Ordre des octets 

Les communications et les echanges de donnees entre ordinateurs heterogenes sont souvent 
confronted au probleme d' ordre des octets dans les valeurs entieres. Pour stocker en memoire 
une valeur tenant sur 2 octets, certains processeurs placent en premiere position l'octet de poids 
faible, puis celui de poids fort. Comme les donnees commencent par leur plus petite extremite, 
cette organisation est nommee Little Endian. A 1' oppose, il existe des machines rangeant 
d'abord l'octet de poids fort, suivi de celui de poids faible. On les qualifie de Big Endian. 



Figure 31 .3 

Stockage en memoire 
de la valeur 0x1234 



Big-endian 



Little-endian 



0x12 



0x34 



0x34 


0x12 







Adresses croissantes 



Le programme suivant affiche la representation en memoire d'une valeur entiere. 
ordre_octets.c : 

#include <stdio.h> 



int 

main (int argc, char * argv[]) 
{ 
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unsigned short int s_i ; 
unsigned char * ch; 
int i ; 



if ((argc != 2) || (sscanf (argv[l] , "Xhl " . & s_i ) != 1) ) { 
fprintf (stderr, "Syntaxe : %s entier \n", argv [0]); 
exi t( EXIT_FAI LURE) ; 

} 

ch = (unsigned char *) & s_i ; 

fprintf (stdout, "%04X represents ainsi ", s_i ) ; 

for (i = 0; i < sizeof(short int); i ++) 

fprintf(stdout, "%02X ", ch[1])j 
fprintf (stdout, "\n"); 
return EXIT_SUCCESS; 



Voici un exemple d'execution sur une machine Little Endian, un PC en l'occurrence : 

$ ./ordre_octets 0x1234 

1234 represents ainsi 34 12 

Et a present sur un processeur Sparc Big Endian, on obtient : 

$ ./ordre_octets 0x1234 

1234 represents ainsi 12 34 

La difference peut meme etre encore plus accentuee avec des donnees sur 32 bits, car la 
valeur 0x12345678 peut etre stockee sous 4 formes : 1234 5678, 5678 1234, 3412 7856, ou 
7856 3412. Naturellement, la premiere et la derniere sont les plus frequentes, mais rien 
n'interdit l'existence des autres. 

Lorsque des donnees binaires doivent etre ecrites sur une machine et relues sur une autre, ce 
probleme peut compliquer serieusement le travail du developpeur car cela interdit entre autres 
Femploi de fwritet ) et de f read( ). Toutefois le probleme reste au niveau de 1' application, 
qui peut utiliser differentes techniques pour y remedier 1 . La oil la situation peut devenir vrai- 
ment genante c'est lorsque des valeurs numeriques sont employees dans les zones de donnees 
du protocole reseau lui-meme. Par exemple la couche IP utilise une valeur numerique entiere 
pour coder le protocole employe par la couche superieure. Nous avons vu ces numeros dans 
la section precedente, dans le membre p_proto de la structure protoent. Lorsque la machine 
de destination recoit un paquet de donnees au niveau de la couche IP, il faut qu'elle puisse 
decoder le numero de protocole, par exemple 17, pour transmettre les donnees a la bonne 
couche de transport, UDP en l'occurrence. Le fait de devoir determiner a chaque paquet 
Fordre des octets de la machine emettrice est une surcharge de travail inacceptable. 

La solution employee dans les protocoles fondes sur IP - et d' autres comme XNS - consiste 
a figer Fordre des octets dans tous les en-tetes des paquets de donnees circulant sur le reseau. 
La forme retenue est Big Endian. Cela signifie que chaque machine doit convertir eventuelle- 
ment l'ordre des donnees. L'avantage est que la bibliotheque C connait a la compilation 



1. Par exemple stacker une valeur connue comme 0x1234 en debut de fichier et la lire pour determiner l'ordre employe lors 
de l'enregistrement, c'est la methode utilisee dans plusieurs formats graphiques. 
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l'ordre des octets sur la station oil elle est installee, et qu'elle n'a pas de questions a se poser : 
soit il faut toujours convertir, soit il ne le faut jamais. 

Pour le programmeur, cela implique toutefois une operation supplementaire. Toutes les 
valeurs numeriques qui seront transmises au protocole reseau devront passer par une etape de 
conversion eventuelle. 



Attention 

Nous parlons bien des valeurs transmises au protocole reseau. Les valeurs contenues dans les donnees de 
I'application ne sont pas concernees, quoique rien n'interdise d'employer le meme mecanisme. 



La bibliotheque C met a notre disposition quatre fonctions permettant de transformer un 
entier long ou court depuis l'ordre des octets de l'hote vers celui du reseau, et inversement. 
Ces routines sont declarees dans <netinet/in.h> : 

unsigned long int htonl (unsigned long int valeur); 

unsigned short int htons (unsigned short int valeur); 

unsigned long int ntohl (unsigned long int valeur); 

unsigned short int ntohs (unsigned short int valeur); 

Les fonctions htonl ( ) et htons ( ) convertissent respectivement des entiers long et court depuis 
l'ordre des octets de l'hote (h) vers (to) celui du reseau (network n). Parallelement, ntohl ( ) et 
ntohs ( ) convertissent les entiers depuis l'ordre des octets du reseau vers celui de l'hote. Nous 
emploierons les conversions d' entiers longs pour les adresses IP (qui sont sur 32 bits en 
version 4), et les conversions courtes pour les numeros de ports que nous allons voir dans la 
prochaine section. 

Nous avons indique precedemment que le numero de protocole indique dans le champ p_proto 
de la structure protoent etait dans l'ordre des octets de l'hote. Ceci nous a permis de les 
afficher directement avec printf ( ) sans passer par une etape de conversion intermediaire. 

Enfin, remarquons qu'un programmeur qui doit choisir une plate-forme de developpement aura 
interet a employer une architecture Little Endian (un PC sous Linux par exemple...) pour 
s'assurer de la portability de ses programmes. En effet, s'il oublie de convertir les donnees, sa 
machine n'etant pas du meme type que le reseau, son programme echouera des le debut. Le bogue 
apparaitra immediatement lors de la mise au point, sans attendre un portage pour se reveler. 

Services et numeros de ports 

Lorsqu'un logiciel desire converser avec un correspondant qui est sur une autre machine, 
nous avons vu que le protocole IP, se trouvant sous les couches TCP ou UDP, permet de trans- 
mettre un paquet de donnees vers la station cible. 

Toutefois, il peut y avoir beaucoup d' applications differentes qui fonctionnent simultanement 
sur la machine visee, et plusieurs d'entre elles peuvent offrir des fonctionnalites reseau. II faut 
done trouver le moyen de preciser quel correspondant nous desirons atteindre parmi les 
processus tournant sur l'ordinateur recepteur. Ceci est assure par une fonctionnalite de la 
couche IP : les numeros de ports. 

Chaque application voulant utiliser les services de la couche IP se verra affecter un numero de 
port, e'est-a-dire un entier sur 16 bits qui permettra d' identifier le canal de communication au 
sein de la machine. C'est ici que se differencient les fonctionnalites de transmission de la 
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couche IP et celles de la couche UDP. Lorsqu'on envoie un paquet UDP, on lui affecte une 
adresse de destination mais egalement un numero de port. La couche IP de la machine recep- 
trice passera les donnees a F application associee a ce port. 

Le processus emetteur est lui aussi dote d'un numero de port, qui est d'ailleurs inscrit dans 
Fen-tete du paquet transmis, mais on s'interesse generalement au numero de port du recep- 
teur plutot qu'a celui de l'emetteur. 

Les numeros de ports inferieurs a 255 sont strictement reserves a des services bien definis, 
disponibles sur de nombreux systemes. Par exemple, le port 1 19 est reserve au service NNTP 
(Network News Transfer Protocol), c'est-a-dire au serveur Usenet. On peut se connecter 
directement avec l'utilitaire tel net en lui precisant le numero de port : 

$ telnet localhost 119 
Trying 127.0.0.1. . . 
Connected to localhost. 
Escape character is '*]'. 

200 Leafnode NNTP Daemon, version 1.9.10 running at venux.ccb.fr 
GROUP fr.comp.os.linux.annonces 

211 43 2 44 fr.comp.os.linux.annonces group selected 
HEAD 44 

221 44 <ftp-20000308100005@Linux.EU.Org> article retrieved - head follows 

Path: club-internet!grolier!f reenixlenst Ienst.fr Imelch ior.cuivre.fr. eu.org 

lexcal ibur!fr.miroir!not-for-mail 

Message- ID: <ftp-20000308100005@Linux.EU.0rg> 

From: ftpmaint@lip6.fr (Marc Victor) 

Newsgroups: fr.comp.os.linux.annonces 

Subject: [MIRROR] Nouveaux fichiers Linux sur ftp.lip6.fr 

Date: 08 Mar 2000 10:00:05 +0100 

References: <ftp-20000305100005@Linux.EU.Org> 

Lines: 177 

X-Posted-By: poste.sh version 1.1 
Followup-To: poster 
Approved: fcola@Linux.EU.0rg 

QUIT 

205 Always happy to serve! 
Connection closed by foreign host. 
$ 

Les numeros de ports inferieurs a 1024 ne peuvent etre associes qu'a des processus ayant un 
UID effectif nul ou la capacite CAP_NET_BIND_SERVICE. Ceci permet a un correspondant de 
savoir qu'il a bien affaire a un service officiel de la machine cible et pas a une application 
pouvant etre faussee par un pirate. Les autres numeros peuvent etre employes par n'importe 
quel utilisateur. 

Precisons bien que les numeros de ports TCP et les numeros de ports UDP sont tout a fait 
distincts. On peut rencontrer simultanement des canaux de communication TCP et UDP ayant 
le meme numero tout en etant totalement independants. 

On doit done preciser pour joindre un processus distant : 

• l'adresse IP de la machine sur laquelle il s'execute ; 

• le numero de port de reception ; 

• le protocole (UDP ou TCP) employe. 
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Lorsqu'une machine dispose de plusieurs interfaces reseau (plusieurs cartes, ou une carte et 
une liaison PPP par exemple), les numeros de ports sur chaque interface sont egalement inde- 
pendants. 

Pour connaitre 1' association entre un numero de port et un service particulier, on peut consulter 
le fichier /etc/services. Celui-ci contient les numeros attribues a environ 300 services 
courants. Ce fichier est consultable par tous les utilisateurs : 

$ cat /etc/services 

# /etc/services: 

§ $Id: services, v 1.4 1997/05/20 19:41:21 tobias Exp $ 



# 

# Network services, Internet style 
# 

tcpmux 1/tcp # TCP port service multiplexer 

echo 7/tcp 

echo 7/udp 

discard 9/tcp sink null 

discard 9/udp sink null 

systat 11/tcp users 
[...] 

ftp 21/tcp 

fsp 21/udp fspd 

ssh 22/tcp # SSH Remote Login Protocol 

ssh 22/udp # SSH Remote Login Protocol 

telnet 23/tcp 

# 24 - private 

smtp 25/tcp mail 

# 26 - unassigned 

time 37/tcp timserver 

time 37/udp timserver 
[...] 

fido 60179/tcp § Ifmail 

fido 60179/udp # Ifmail 



# Local services 



linuxconf 98/tcp 
$ 

Sur certains systemes, le fichier /etc/services est complete par des donnees provenant d'un 
serveur NIS, accessible avec ypcat -k services. 

On remarque que certains services offrent a la fois une interface en TCP et en UDP, alors que 
d'autres ne travaillent que dans un seul mode. II peut exister des alias, par exemple le service 
de messagerie smtp peut etre aussi invoque sous le nom mai 1 . 

$ telnet localhost smtp 

Trying 127.0.0.1. . . 
Connected to localhost. 
Escape character is '*]'. 

220 venux.ccb.fr ESMTP Sendmail 8.9.3/8.9.3; 
QUIT 

221 venux.ccb.fr closing connection 
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Connection closed by foreign host. 
$ telnet local host mail 
Trying 127.0.0.1. . . 
Connected to localhost. 
Escape character is '*]'. 

220 venux.ccb.fr ESMTP Sendmail 8.9.3/8.9.3; 
QUIT 

221 venux.ccb.fr closing connection 
Connection closed by foreign host. 

$ 

Pour creer une socket de communication, il est necessaire de connaitre le numero de port a 
utiliser. Toutefois, on ne peut pas demander a l'utilisateur d'indiquer lui-meme la valeur 
numerique. II faut l'autoriser a employer un mot-cle indique dans le fichier /etc/services, 
meme s'il s'agit d'une application locale. Comme pour le fichier des protocoles, il existe des 
routines de bibliotheque pour nous aider a rechercher des services sur le systeme. 

La fonction getservbyname( ), declaree dans <netdb.h>, permet de retrouver un service a 
partir de son nom ou d'un alias : 

struct servent * getservbyname (const char * nom, const char * protocole); 

Cette routine prend en premier argument une chaine de caracteres indiquant le nom du 
service, par exemple « ftp », et en seconde position une chaine de caracteres mentionnant le 
protocole concerne, comme nous Favons determine dans la section precedente. 

La fonction getservbyport( ) permet de chercher un service a partir du numero de port 
indique dans l'ordre des octets du reseau. 

struct servent * getservbyport (short int numero, const char * protocole); 

La structure servent fournie par ces routines est definie ainsi : 





Nom 


Type 


Signification 


s. 


jiame 


char * 


Nom officiel du service defini dans la RFC 1700 


s. 


.port 


short int 


Numero du service dans l'ordre des octets du reseau 


s. 


_proto 


char * 


Nom du protocole associe 


s. 


_al i ases 


char ** 


Liste eventuelle d'alias, terminee par un pointeur NULL 



Le programme suivant affiche les resultats concernant les services indiques sur sa ligne de 
commande. Ceux-ci peuvent etre fournis sous forme numerique ou par un nom. 

exemple_getservby.c : 

#include <stdio.h> 
#include <netinet/in.h> 
#include <netdb.h> 

void affiche_service (char * nom, char * proto); 



int 

main (int argc, char * argv[]) 
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{ 

int i ; 

for (i =1; i < argc; i ++) { 

affi che_service(argv[i ] , "tcp" ) ; 
affiche_service(argv[i] , "udp") ; 

} 

return EXIT_SUCCESS; 



void 

affiche_service (char * nom, char * proto) 
{ 

int i; 

int port; 

struct servent * service; 

if (sscanf (nom, "Id", & port) == 1) 

service = getservbyportthtons(port) , proto); 

el se 

service = getservbynametnom, proto); 
if (service == NULL) { 

fprintf (stdout, "%s / %s : inconnu \n", nom, proto); 
} else { 

fprintf (stdout, "%s / Is : %s ( ", 

nom, proto, service->s_name) ; 
for (i = 0; service->s_al iases[i ] != NULL; i ++) 

fprintf (stdout, "%s ", service->s_al iases[i ] ) ; 
fprintf (stdout, ") port = %d\r\" , ntohs(service->s_port)); 

} 

} 

Comme nous ne precisons pas sur la ligne de commande le protocole employe, le programme 
essaye successivement TCP et UDP. 

$ ./exemple_getservby mail 21 

mail / tcp : smtp ( mail ) port = 25 

mail / udp : inconnu 

21 / tcp : ftp ( ) port = 21 

21 / udp : fsp ( fspd ) port = 21 

$ ./exemple_getservby NNTP nntp 

NNTP / tcp : inconnu 

NNTP / udp : inconnu 

nntp / tcp : nntp ( readnews untp ) port = 119 

nntp / udp : inconnu 

$ 

II est possible aussi de parcourir entierement la liste des services connus par le systeme a 
l'aide des routines setservent( ), getserventO et endservent( ), qui ont un comportement 
similaire a setprotoent( ), getprotoentt ) et endprotoent( ). 

void setservent (int ouvert); 

struct servent * getservent (void); 
void endservent (void); 
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Attention, le fait qu'un service soit connu par le systeme ne signifie pas qu'il y ait un 
processus pret a lui repondre. Par exemple le service systat fournit des informations qui 
peuvent renseigner un eventuel pirate, aussi le desactive-t-on souvent : 

$ ./exemple_getservby systat 

systat / tcp : systat ( users ) port = 11 
systat / udp : inconnu 
$ telnet local host systat 
Trying 127.0.0.1. . . 

telnet: Unable to connect to remote host: Connexion refusee 
$ 

Mentionnons l'existence de fonctions reentrantes, sous forme d' extensions Gnu : 

int getservbyport_r (short int numero, 

struct servent * service, 

char * buffer, size_t taille_buffer, 

struct servent ** retour); 
int getservbyname_r (const char * nom, 

struct servent * service, 

char * buffer, size_t taille_buffer, 

struct servent ** retour); 
int getservent_r (struct servent * service, 

char * buffer, size_t taille_buffer, 

struct servent ** retour); 

Voici un exemple de balayage de tous les services. 
exemple_getservent r.c : 

#define _GNU_S0URCE 
#include <stdio.h> 
#include <netdb.h> 



int 
main (void) 

{ 

struct servent service; 
struct servent * retour; 
char buffer[256]; 



setservent(O) ; 

while (getservent_r(& service, buffer, 256, & retour) == 0) 

fprintf (stdout, "%s ", service. s_name) ; 
endservent( ) ; 
fprintf (stdout, "\n"); 
return EXIT_SUCCESS; 



Manipulation des adresses IP 

Le protocole IP version 4 offre le routage des paquets a destination d' notes dont le nom est 
indique par une adresse sur 32 bits. Nous avons deja precise que cette adresse est souvent 
ecrite dans la notation pointee, en separant les octets et en les affichant en decimal. La valeur 
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est done contenue dans un unsigned long int. Neanmoins les fonctions de communication 
disponibles, que nous verrons dans le prochain chapitre, sont utilisables sur d'autres supports 
que le protocole IPv4, ne serai t-ce que FIPv6 qui est deja disponible a titre experimental et 
reclame des adresses sur 48 bits. On peut aussi vouloir faire communiquer des processus resi- 
dant tous sur la meme machine, et les memes routines de communication sont disponibles 
avec un adressage realise par 1' intermediate de noms de fichiers. 

La definition d'une adresse est done assuree par une structure qui peut prendre des formes 
diverses suivant le protocole employe. Pour les communications IPv4, on emploie la structure 
i n_addr , definie dans <neti net/i n . h> avec un seul membre : 

Nom Type Signification 

s_addr unsigned long int Adresse IP dans I'ordre des octets du reseau 

La structure in6_addr utilisee pour les adresses IPv6 est plus compliquee puisqu'elle se 
presente sous forme d'uni on. Nous la considererons comme un type opaque. 

II existe des fonctions, declarees dans <arpa/inet.h>, permettant de convertir directement 
1' adresse in_addr en notation pointee, et inversement. La routine inet_ntoa() {Network to 
Ascii) renvoie une chaine de caracteres statiques representant en notation pointee 1' adresse 
transmise en argument. 

char * inet_ntoa (struct in_addr adresse); 



Attention 

On passe bien la valeur de la structure, et pas un pointeur. 



II n'y a pas d' equivalent reentrant. La documentation Gnu precise que chaque thread dispose 
de son propre buffer et qu'il n'y a done pas de problemes d'acces concurrents. Toutefois pour 
assurer la portability sur d'autres plates-formes, on emploiera dans un programme multit- 
hread un semaphore pour organiser les appels simultanes et Faeces a la memoire statique 1 . 

La fonction inverse, inet_aton( ) , remplit la structure i n_addr passee en second argument en 
ayant converti la chaine pointee transmise en premiere position. Si cette chaine est invalide, 
inet_aton( ) renvoie 0. 

int inet_aton (const char * chaine, struct in_addr * adresse); 

Cette fonction n'est malheureusement disponible que sur peu de systemes. Lors d'un portage, 
on peut employer inet_addr( ), qui prend en argument la chaine en notation pointee et renvoie 
directement l'adresse sous forme d'entier long non signe. 

unsigned long int inet_addr (const char * chaine); 

Le probleme est qu'en cas d'echec cette routine renvoie une valeur particuliere INADDR_NONE, 
qui peut aussi representer une adresse valide : 255.255.255.255. On l'utilisera done unique - 
ment si i net_aton( ) n'est pas disponible. 



1. On notera aussi qu'on ne peut pas afficher les resultats de plusieurs inet_ntoa( ) successifs dans le meme printf ( ). 
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Voici un programme qui emploie les arguments en ligne de commande avec ces trois routines : 
exemple_inet_aton.c : 

#include <stdio.h> 
#include <arpa/inet.h> 
#include <netinet/in.h> 

int 

main (int argc, char * argv[]) 

{ 

struct in_addr adresse; 
int i; 

for (i = 1; i < argc; i ++) { 

fprintf (stdout, "inet_aton (%s) = ", argv [i]); 
if (inet_aton(argv[i], & adresse) == 0) { 

fprintf (stdout, "invalide \n"); 

continue; 

} 

fprintf (stdout, "M8X \n", ntohl (adresse . s_addr)); 

fprintf (stdout, "inet_addr(^s) = ", argv[i]); 

if ((adresse. s_addr = inet_addr(argv[i])) == INADDR_N0NE) { 

fprintf (stdout, "invalide \n"); 

continue; 

} 

fprintf (stdout, "M8X \n", ntohl (adresse. s_addr)) ; 
fprintf (stdout, "inet_ntoa(%08X) = %s \n", 

ntohl (adresse.s_addr) , 

inet_ntoa(adresse) ) ; 

} 

return EXIT_SUCCESS; 

} 

Nous remarquons bien le probleme que pose inet_addr( ) par rapport a inet_aton( ) : 

$ ./exemple_inet_«ton 172.16.15.1 

inet_aton(172.16.15.1) = AC100F01 
inet_addr(172.16.15.1) = AC100F01 
inet_ntoa(AC100F01) = 172.16.15.1 
$ ./exemple_inet_aton 255.255.255.255 
inet_aton(255.255.255.255) = FFFFFFFF 
inet_addr(255.255.255.255) = invalide 
$ 

La constante INADDR_N0NE a la meme valeur que INADDR_BROADCAST, qui correspond a une 
adresse (255.255.255.255) employee pour diffuser un message vers tous les hotes accessibles. 
Nous reviendrons sur ce sujet ulterieurement. 

Les adresses IP sont organisees en sous-reseaux, afin de simplifier les routages. Chaque 
sous-reseau possede une adresse, et chaque machine a elle-meme une adresse au sein du sous- 
reseau. L adresse IP complete est obtenue en faisant suivre F adresse du sous-reseau par 
celle de la station. Ainsi, si on a un sous-reseau 192.1.1, sa station numero 2 aura 1' adresse 
192.1.1.2. Cette organisation permet a un routeur de savoir sur quel brin Ethernet se trouve 
un hote sous sa responsabilite. 
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Les sous-reseaux definis par le NIC (Network Information Center), qui gere les adressages 
sur Internet, sont repartis en plusieurs categories : 

• Les 127 sous-reseaux de classe A ont des adresses allant de 1 . a 127 . Chacun d'eux peut 
adresser ses stations sur 24 bits, ce qui leur permet de regrouper plus d'un million de 
machines. 

• Les adresses des sous-reseaux de classe B vont de 128 . 0 . a 191 . 255. II y en a plus de seize 
mille, chacun pouvant contenir des machines avec des adresses sur 16 bits. II y a un peu 
plus de 65 000 stations adressables par reseau. 

• Les sous-reseaux de classe C s'etendent de 192.0.0. a 223.255.255. Chacun de ces deux 
millions de sous-reseaux peut contenir 254 hotes, car les adresses .0 et .255 ne sont pas 
utilisables. 

• La classe D s'etend de 224.0.0.0 a 239.255 .255.255. II ne s'agit pas d' adresses de machines, 
mais uniquement d' adresses de diffusion multicast. Nous detaillerons ce concept dans le 
prochain chapitre. 

II existe d'autres classes pour les adresses superieures a 240., mais il s'agit uniquement 
d'utilisations experimentales. 

Les deux fonctions inet_netof ( ) et inet_l naof ( ) sont capables d'extraire respectivement la 
partie reseau et la partie adresse locale d'une adresse IP complete. 

unsigned long int inet_netof (struct in_addr); 
| unsigned long int inet_lnaof (struct in_addr); 

Elles renvoient un entier long non signe dans l'ordre des octets de l'hote. 
exemple_inet_netof.c : 

#include <stdio.h> 
#include <arpa/inet.h> 
#include <netinet/in.h> 

int 

main (int argc, char * argv[]) 
{ 

int i ; 

struct in_addr adresse; 
unsigned long int reseau; 
unsigned long int locale; 

for (i =1; i < argc; i ++) { 

fprintf (stdout, "inet_netof Us) = ", argv[i]); 
if (inet_aton(argv[i ] , & adresse) == 0) { 

fprintf (stdout, " i rival i de \n"); 

continue; 

} 

reseau = inet_netof (adresse) ; 
locale = inet_lnaof (adresse) ; 

fprintf(stdout, "%081X + %081X\n", reseau, locale); 

} 

return EXIT_SUCCESS; 
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Nous allons l'essayer successivement avec des adresses de classe A, B et C : 

$ ./exemple_inet_netof 1.2.3.4 

inetjetof (1.2.3.4) = 00000001 + 00020304 

$ ./exemple_inet_netof 128.2.3.4 

inetjetof (128.2.3.4) = 00008002 + 00000304 

$ ./exemple_inet_netof 192.2.3.4 

inetjetof (192.2.3.4) = 00C00203 + 00000004 

$ 

On peut remarquer que inet_netof ( ) extrait vraiment Fadresse du sous-reseau et n'effectue 
pas simplement un masque. On peut toutefois avoir besoin de cette fonctionnalite pour 
presenter les resultats a Futilisateur. On peut l'implementer ainsi : 

masque_reseau.c : 

#include <stdio.h> 
#include <arpa/inet.h> 
#include <netinet/in.h> 



main (int argc, char * argv[]) 

{ 

int i ; 

struct in_addr adresse; 
struct in_addr reseau; 
struct in_addr locale; 

for (i =1; i < argc; i ++) { 

fprintf (stdout, "%s : \n", argv[i]); 

if (inet_aton(argv[i], & adresse) == 0) { 

fprintf (stdout, " invalide \n"); 

continue; 



adresse. s_addr = ntohl (adresse . s_addr); 
if (adresse. s_addr < 0x80000000L) { 

reseau. s_addr = adresse. s_addr & OxFFOOOOOOL; 

locale. s_addr = adresse. s_addr & OxOOFFFFFFL; 
} else if (adresse. s_addr < OxCOOOOOOOL) { 

reseau. s_addr = adresse. s_addr & OxFFFFOOOOL; 

locale. s_addr = adresse. s_addr & OxOOOOFFFFL; 
} else { 

reseau. s_addr = adresse. s_addr & OxFFFFFFOOL; 
locale. s_addr = adresse. s_addr & OxOOOOOOFFL; 

} 

reseau. s_addr = htonl (reseau. s_addr) ; 
locale. s_addr = htonl (locale. s_addr) ; 

fprintf (stdout, " adresse reseau = %s\n", inet_ntoa(reseau)); 
fprintf (stdout, " adresse locale = £s\n", inet_ntoa(locale)); 



i nt 



return EXIT_SUCCESS; 
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Cette fois-ci les affichages correspondent bien aux diverses parties de l'adresse IP complete : 

$ . /masque_reseau 1.2.3.4 

1.2.3.4 : 

adresse reseau = 1.0.0.0 

adresse locale = 0.2.3.4 
$ . /masque_reseau 172.16.15.1 
172.16.15.1 : 

adresse reseau = 172.16.0.0 

adresse locale = 0.0.15.1 
$ ./masque_reseau 192.1.1.20 
192.1.1.20 : 

adresse reseau = 192.1.1.0 

adresse locale = 0.0.0.20 

$ 

Les fonctions inet_ntoa() et inet_aton() presentent le defaut d'etre liees aux adresses IP 
version 4. Dans le protocole IPv6, les adresses sont representees sur 128 bits, qu'on ecrit sous 
forme de huit valeurs hexadecimales sur 16 bits, separees par des deux-points (par exemple 
4235 :la05: 0653 :5d48:lb94: 5710 :32c4:ae25). 

Les deux fonctions inet_ntop() et inet_pton() offrent les memes services, mais en etant 
pretes pour l'adressage IPv6. Le p signifie presentation. 

const char * inet_ntop (int famille, const void * adresse, 
char * buffer, size_t longueur); 

Le premier argument doit etre AF_I N ET si on utilise une adresse IPv4 ou AF_I NET6 pour une 
IPv6. Le second argument pointe vers une structure i n_addr en IPv4, ou i n6_addr en IPv6. 

int inet_pton (int famille, const char * chaine, void * adresse) 

Comme pour inet_ntop( ), on indique la famille (AF_I NET ou AF_INET6) en premier argument, 
et on donne un pointeur vers la structure in_addr ou in6_addr en derniere position. Le 
programme suivant essaye successivement les deux types de conversion sur ses arguments en 
ligne de commande. 

exemple_inet_pton.c : 

#include <stdio.h> 
#include <arpa/inet.h> 
#include <netinet/in.h> 

int 

main (int argc, char * argv[]) 
{ 

struct in6_addr adresse_6; 
struct in_addr adresse_4; 
int i ; 

char buffer [256]; 

for (i = 1; i < argc; i ++) { 

fprintf (stdout, "inet_pton(%s) = ", argv[i]); 

if (inet_pton(AF_INET6, argv[i], & adresse_6) != 0) { 
fprintf(stdout, "IPv6 : "); 
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inet_ntop(AF_INET6, & adresse_6, buffer. 256); 
fprintf (stdout, "inet_ntop( ) = %s \n", buffer); 
continue; 

} 

if (inet_pton(AF_INET, argv[i], & adresse_4) != 0) { 
fprintf (stdout, "IPv4 : "); 
inet_ntop(AF_INET, & adresse_4, buffer, 256); 
fprintf (stdout, "inet_ntop() = %s \n", buffer); 
continue; 

} 

fprintf (stdout, "invalide \n"); 

} 

return EXIT_SUCCESS; 

} 

On peut convertir correctement les deux types d'adresses. 
$ ./exemple_inet_pton 192.1.1.10 

inet_pton(192.1.1.10) = IPv4 : inet_ntop() = 192.1.1.10 

$ ./exemple_inet_pton ::2 

inet_pton( : :2) = IPv6 : inet_ntop() = ::2 

$ ./exemple_inet_pton 4235:la05:0653:5d48:lb94:5710:32c4:ae25 

inet_pton (4235:la05:0653:5d48:lb94:5710:32c4:ae25) = IPv6 : inet_ntop () 

* = 4235:la05:653:5d48:lb94:5710:32c4:ae25 

$ 



Attention 

Ces fonctions ne sont pas tres repandues, leur portability est loin d'etre assuree. 



Noms d'hotes et noms de reseaux 

Les adresses IP des machines ne sont pas faciles a memoriser (surtout en IPv6 !). Pour simpli- 
fier la vie des administrateurs et des utilisateurs, on associe done des noms aux stations. 
Lorsqu'il n'y a que deux ou trois machines sur un meme reseau, on inscrit simplement les 
correspondances dans le fichier /etc/hosts. Cependant, des qu'on depasse une dizaine de 
stations, la maintenance de tous les fichiers hosts se complique car il faut tous les modifier 
des qu'une machine est ajoutee. 

On emploie alors un serveur de noms, e'est-a-dire un logiciel capable de repondre a des 
requetes pour obtenir l'adresse d'une machine dont on connait le nom. La base de donnees est 
alors centralisee en un seul point sous le controle de l'administrateur. Le serveur de noms est 
aussi capable - lorsqu'il ne peut pas repondre - d'indiquer l'adresse d'un autre serveur mieux 
qualifie pour traiter la demande. 

L interrogation du serveur de noms se fait a l'aide de routines de bas niveau assez complexes, 
dont nous ne parlerons pas ici. Heureusement, la bibliotheque C offre des routines permettant 
de rechercher facilement un hote a partir de son nom ou de son adresse. 
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Les informations concernant un hote sont regroupees dans une structure hostent definie 
ainsi : 





Nom 




Sirinificafion 


h. 


_name 


char * 


Nom d'hote officiel. 


h. 


_al iases 


char * * 


Liste d'alias, terminee par un pointeur NULL. 


h. 


_addrtype 


int 


Type d'adresse, AF_I.NET ou AF_INET6. 


h. 


_1 ength 


int 


Longueur des adresses du type indique ci-dessus, en octets. 


h. 


_addr_l ist 


char ** 


Liste d'adresses correspondant a cet hote (il peut y avoir plusieurs interfaces reseau 

et le meme nom sur chacune d'elles). 

Les adresses sont donnees dans I'ordre des octets du reseau. 


h. 


_addr 


char * 


Equivalent de h_addr_l ist [0]. 



Les adresses de la liste h_addr_l i st[] ne sont pas des chaines de caracteres mais des blocs de 
memoire qu'on pourra convertir en structure i n_addr ou i n6_addr. 

Les fonctions gethostbyname( ) et gethostbyaddr( ) permettent de retrouver les informations 
concernant un hote a partir de son nom ou de son adresse IP. II existe des fonctions equiva- 
lentes reentrantes, sous forme d'extensions Gnu, gethostbyname_r( ) et gethostbyaddr_r( ). 

struct hostent * gethostbyname (const char * nom); 
struct hostent * gethostbyaddr (const char * adresse, 

int longueur, int format); 
int gethostbyname_r (const char * nom, 

struct hostent * hote, 

char * buffer, size_t taille_buffer 

int * erreur) ; 
int gethostbyaddr_r (const char * adresse, 

int longueur, int format); 

struct hostent * hote, 

char * buffer, size_t taille_buffer 

int * erreur) ; 

Largument format de gethostbyaddr( ) correspond a AF INET ou AF_INET6. Le dernier argu- 
ment des fonctions reentrantes est un pointeur dans lequel on memorisera les conditions 
d'erreur. On detaillera ceci plus bas. 

Lextension Gnu gethostbynameZ( ) et son equivalent gethostbyname2_r( ) permettent de 
restreindre le champ de recherche en indiquant la famille IP desiree : 

struct hostent * gethostbyname2 (const char * nom, int famille); 
int gethostbyname2_r (const char * nom, int famille, 

struct hostent * hote, 

char * buffer, size_t tai 1 1 e_buf fer 

int * erreur) ; 

Le programme suivant va permettre d'obtenir des informations sur les noms ou adresses d'hotes 
passes en ligne de commande. II essaye successivement de les lire comme une adresse IPv4, 
une adresse IPv6, et un nom d'hote. Dans tous les cas, il recherche la structure hostent 
correspondante et affiche les resultats. 
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exemple_gethostby.c : 

#include <stdio.h> 
#include <arpa/inet.h> 
#include <netdb.h> 
#include <netinet/in.h> 
#include <sys/types.h> 

int 

main (int argc, char * argv []) 

{ 

int i, j; 

struct hostent * hote; 

struct in_addr adresse_4; 

struct in6_addr adresse_6; 

struct in_addr * ip_4; 
struct in6_addr * ip_6; 

char buffer [256]; 

for (i = 1; i < argc; i ++) { 

fprintf (stdout, "%s : ", argv[i]); 

/* Verifions d'abord s'il s'agit d'une adresse pointee IPv4 */ 
if (inet_aton(argv[i], & adresse_4) != 0) { 
/* On recupere la structure hostent */ 
if ((hote = gethostbyaddr( (char *) & adresse_4, 

sizeof (struct in_addr), AF_INET) ) == 0) { 
fprintf(stdout, "??? \n"); 
continue; 

} 

/* Sinon on recherche une adresse IPv6 */ 
} else if (inet_pton(AF_INET6, argv[i], & adresse_6) != 0) ( 
if ((hote = gethostbyaddr( (char *) & adresse_6, 

sizeof (struct in6_addr), AF_INET6) ) == 0) { 
fprintf(stdout, "??? \n"); 
continue; 

} 

} else { 

/* On interroge la resolution de noms */ 

if ((hote = gethostbyname(argv[i ] ) ) == NULL) { 

fprintf(stdout, "??? \n"); 

continue; 

} 

} 

/* On peut afficher le contenu de la structure hostent */ 

fprintf (stdout, "%s (", hote->h_name) ; 

for (j = 0; hote->h_aliases[j] != NULL; j ++) 

fprintf (stdout, " %s" , hote->h_al iases[j] ) ; 
fprintf (stdout, " ) : "); 
if (hote->h_addrtype == AF_INET6) { 

for (j = 0; hote->h_addr_list[j] ! = NULL; j ++) { 

ip_6 = (struct in6_addr *) (hote->h_addr_l i st[j] ) ; 

inet_ntop(AF_INET6, ip_6, buffer, 256); 

fprintf (stdout, "Is ", buffer); 
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} 

} else { 

for (j = 0; hote->h_addr_list[j] != NULL; j ++) { 
ip_4 = (struct in_addr *) ( hote->h_addr_l i st[ j ] ) ; 
fprintf (stdout, "%s ", inet_ntoa(* ip_4)); 

} 

} 

fprintf (stdout, "\n"); 

} 

return EXIT_SUCCESS; 

} 

Naturellement, la resolution s'effectue en utilisant le fichier /etc/hosts local mais aussi en 
interrogeant les serveurs de noms. 

$ ./exemple_gethostby localhost 

localhost : localhost ( localhost. localdomain ) : 127.0.0.1 

$ ./exemple_gethostby venux 

venux : venux ( venux.ccb.fr ) : 192.1.1.51 

$ ./exemple_gethostby 192.1.1.51 

192.1.1.51 : venux ( venux.ccb.fr ) : 192.1.1.51 

$ ./exemple_gethostby ftp.lip6.fr 

ftp.lip6.fr : nephtys.lip6.fr ( ftp.lip6.fr ) : 195.83.118.1 
$ ./exemple_gethostby sunsite.unc.edu 
sunsite.unc.edu : sunsite.unc.edu ( ) : 152.2.254.81 
$ ./exemple_gethostby 195.36.208.117 

195.36.208.117 : Corbeil-2-117.club-internet.fr ( ) : 195.36.208.117 
$ 

Nous avons ajoute pas mal de code dans le programme, uniquement pour etre capable de 
traiter les adresses IPv6 alors qu'elles ne sont pas encore employees. On peut simplifier large- 
ment le travail pour une application ne desirant pas les gerer. 

La bibliotheque C nous offre egalement des routines pour consulter l'ensemble de la base de 
donnees des notes se trouvant dans le meme domaine que le notre. Les fonctions sethostent( ), 
gethostentO et endhostentO ont un comportement similaire a setserventC ), getserventO 
et endservent( ) que nous avons deja observees : 

void sethostent (int ouvert); 

struct hostent * gethostent (void); 
void endhostent (void); 

exemple_gethostent.c : 

#include <stdio.h> 
//include <stdlib.h> 
#include <netdb.h> 

int 
main (void) 
{ 

struct hostent * hote; 
sethostentt 1 ) ; 

while ((hote = gethostentO) != NULL) 
fprintf (stdout, "%s ", hote->h_name) ; 
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printf (stdout, "\n"); 
endhostent( ) ; 
return EX IT_SUCCESS ; 

L' execution affiche la liste des machines du me me domaine : 
$ . /exempl e_gethostent 

localhost venux tracy gimli visux jcv matisse ifr-cdg ifr-orly 

Indiquons pour finir qu'il existe une base de donnees des sous-reseaux, moins connue que la 
base des noms d'hotes, car elle est plutot employee pour 1' administration du systeme qu'au 
quotidien. Cette base de donnees est souvent constituee par le fichier /etc/network. Les fonc- 
tions d'acces manipulent des structures netent, definies ainsi : 



Norn 


Type 


Signification 


n_name 


char * 


Norn du sous-reseau 


n_al i ases 


char ** 


Liste d'alias terminee par un pointeur NULL 


n_addrtype 


Int 


Type d'adresses sur le sous-reseau (uniquement AF_I NET pour le moment) 


n net 




unsigned long int 


Adresse du sous-reseau, dans I'ordre des octets de l'hote 



Les fonctions d'acces sont getnetbyname( ), getnetbyaddr( ) et, pour balayer la base des sous- 
reseaux, on emploie setnetent( ), getnetent( ) et endnetent( ). 

struct netent * getnetbyname (const char * nom); 

struct netent * getnetbyaddr (unsigned long int adresse, int type); 

void setnetent (int ouvert); 

struct netent * getnetent (void); 

void endnetent (void); 



Gestion des erreurs 

Les fonctions d'acces a la base de donnees des notes n'emploient pas directement errno mais 
une autre variable globale, h_errno, declaree dans <netdb.h>. Dans la bibliotheque GlibC, 
cette variable est dupliquee pour chaque thread et peut done etre employee sans danger dans 
un programme multithread. 

Les codes d'erreur qu'on peut y trouver au retour de toutes les routines gethostXXX( ) sont les 
suivants : 



Nom 


Signification 


NETDB_SUCCES 


Pas d'erreur. 


H0ST_N0T_F0UND 


L'hote n'a pas ete trouve. 


TRY_AGAIN 


Un probleme temporaire de serveur de noms est apparu. On peut reiterer la demande. 


N0_REC0VERY 


Une erreur critique est apparue durant la resolution du nom. 


N0_ADRESS 


L'hote est connu du serveur de noms, mais il n'a pas d'adresse valide. 
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Les fonctions herrorO et hstrerrorO sont considerees comme obsoletes. Elles sont l'equi- 
valent de perror( ) et strerror( ), appliquees a h_errno. 

void herror (const char * chaine); 

const char * hstrerror (int erreur); 

Conclusion 

Nous avons examine dans ce chapitre l'essentiel des moyens d'acces aux bases de donnees 
permettant la resolution de noms - tant au niveau des notes que des services et des protocoles. 
Une grosse partie du travail dans les programmes reseau repose sur ces routines. 

Pour obtenir plus d'informations, on peut consulter bien entendu [STEVENS 1990] UNIX 
Network Programming - qui est un grand classique de ce domaine. 

En ce qui concerne l'installation et F administration d'un reseau sous Linux, on conseillera a 
nouveau [Kirch 2001] L' administration reseau sous Linux, et le NET-3-HOWTO. 

Enfin, on trouvera ci-dessous quelques references des documents RFC definissant les princi- 
paux protocoles utilises sur Internet. 



Numero RFC 


Auteur et date 


Sujet 


RFC 791 


J.Postel, 01/09/1981 


IP : Internet Protocol. 


RFC 792 


J.Postel, 01/09/1981 


ICMP : Internet Control Message Protocol. 


RFC 793 


J.Postel, 01/09/1981 


TCP : Transmission Control Protocol. 


RFC 768 


J.Postel, 28/08/1980 


UDP : User Datagram Protocol. 


RFC 959 


J. Postel, J. Reynolds, 01/10/1985 


FTP : File Transfert Protocol. 


RFC 783 


K.R. Sollins, 01/06/1981 


TFTP : Trivial File Transfert Protocol. 


RFC 821 


J.Postel, 01/08/1982 


SMTP : Simple Mail Transfert Protocol. 


RFC 977 


B.Kantor, 01/02/1986 


NNTP : Network News Transfer Protocol. 


RFC 854 


J. Postel, J. Reynolds, 01/05/1983 


Telnet Protocol. 


RFC 1918 


Y. Rekhter et al. 01/02/1996 


Adresses IP utilisables sur un reseau prive. 


RFC 2500 


J. Reynolds, 01/06/1999 


Protocoles standard sur Internet. 


RFC 1700 


J. Reynolds, J. Postel, 01/10/1994 


Noms et numeros standard pour tout ce qui concerne les 
communications sur Internet. 



A present que nous savons determiner l'adresse d'un correspondant et le service qui nous 
interessent, nous allons pouvoir enfin etablir la communication avec un processus distant dans 
le prochain chapitre. 
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Concept de socket 

Les sockets 1 sont apparues dans 4.2BSD, en 1983. Elles sont a present disponibles sur tous 
les Unix courants, et il en existe des variantes sur les autres principaux systemes d' exploita- 
tion. II s'agit approximativement d'une extension de la portee des tubes nommes, pour 
pouvoir faire dialoguer des processus s'executant sur differentes machines. 

On peut done ecrire des donnees dans une socket apres 1' avoir associee a un protocole de 
communication, et les couches reseau des deux stations s'arrangeront pour que les donnees 
ressortent a F autre extremite. La seule complication introduite par rapport aux tubes classi- 
ques est la phase d'initialisation, car il faut indiquer Fadresse et le numero de port du corres- 
pondant. Une fois que la liaison est etablie, le comportement ne sera pas tres different de ce 
qu'on a etudie dans le chapitre 28. 

Les sockets sont representees dans un programme par des entiers, comme les descripteurs 
de fichiers. On peut leur appliquer les appels-systeme usuels, readO, writeO, selectO, 
closeO, etc. Nous verrons dans ce chapitre les primitives specifiques qui s'appliquent aux 
sockets. 

Creation d'une socket 

La premiere etape consiste a creer une socket. Ceci s'effectue a l'aide de l'appel-systeme 
socket( ), defini dans <sys/socket . h> : 

int socket (int domaine, int type, int protocole); 



1 . Le mot socket se traduit par prise en francais (dans le sens de prise de courant), mais j 'utiliserai le mot original, qui est 
devenu un terme consacre. 
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Le premier argument de cette routine est le domaine de communication. II s'agit d'une 
constante symbolique pouvant prendre plusieurs valeurs. En voici quelques exemples : 

• AF_I NET : protocole fonde sur IP. 

• AF_INET6 : protocole IPng, experimental et soumis a des options de compilation dans le 
noyau. 

• A F_U N I X : communication limitee aux processus residant sur la meme machine. Dans certains 
cas cette constante est remplacee par le synonyme AF_L0CAL, qui appartient d'ailleurs a la 
terminologie Posix. 

Nous ne nous interesserons ici qu'au domaine AF_INET, qui regroupe toutes les communica- 
tions reseau avec IP, TCP, UDP ou ICMP 

Le second argument est le type de socket. Nous ne considererons que trois cas : 

• SOCK_STREAM : le dialogue s'effectue en mode connecte, avec un controle de flux d'une 
extremite a F autre de la communication. 

• SOCK_DGRAM : la communication a lieu sans connexion, par transmission de paquets de 
donnees. 

• S0CK_RAW : la socket sera utilisee pour dialoguer de maniere brute avec le protocole. 

Nous reviendrons ulterieurement sur les communications en mode connecte ou non. Finale- 
ment, le troisieme argument indique le protocole desire. II s'agit du champ p_proto de la 
structure protoent examinee dans le chapitre precedent. Si on indique une valeur nulle, les 
combinaisons suivantes seront automatiquement realisees : 



Domaine 


Type 


Socket obtenue 


Protocole equivalent 


AF_INET 


SOCK_STREAM 


Socket de dialogue avec le protocole TCP/IP 


IPPROTOJTP 


AF_I N ET 


SOCK_DGRAM 


Socket utilisant le protocole UDP/IP 


IPPROTOJJDP 



Pour les sockets de type S0CK_RAW, il faut utiliser l'un des deux protocoles suivants : 

• I PPROTCLRAW : communication directe avec la couche IP. 

• I PPR0T0_I CMP : communication utilisant le protocole ICMP. Ceci est utilise par exemple 
dans l'utilitaire /bin /ping. 

La creation d'une socket de type S0CK_RAW necessite la capacite CAP_NET_RAW. Les utilitaires 
qui en emploient (traceroute, ping...) et qui sont ouverts a tous les utilisateurs (a la diffe- 
rence de tcpdump) sont done normalement installes Set-UID root. 

La creation d'une socket a l'aide de l'appel-systeme eponyme ne fait que reserver un empla- 
cement dans la table des descripteurs du noyau. Au retour de cette routine, nous disposons 
d'un entier permettant de distinguer la socket, mais aucun dialogue reseau n'a pris place. 
II n'y a meme pas eu d'echange d' informations avec les protocoles de communication du 
noyau. Celui-ci a simplement accepte de nous attribuer un emplacement dans sa table de 
sockets. 

Le descripteur est superieur ou egal a zero, ce qui signifie qu'une valeur de retour negative 
indique une erreur. Comme aucune communication n'a commence, les seules erreurs possi- 
bles sont : 

• E I NVAL, si le domaine est invalide. 
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• EPROT0N0SUPP0RT, si le type est incoherent avec le protocole ou le domaine. 

• EACCES, si on n'a pas l'autorisation de creer une socket du type demande (par exemple 
AF_I NET et S0CK_RAW). 

A cela s'ajoutent comme toujours EMFILE, ENFILE, ENOMEM si l'espace disponible dans la 
memoire du noyau est insuffisant. 

Avant de pouvoir Futiliser, il faut identifier la socket, c'est-a-dire definir Fadresse complete 
de notre extremite de communication. Le nom affecte a la socket doit permettre de la trouver 
sans ambiguite en employant le protocole reseau indique lors de sa creation. Pour les commu- 
nications fondees sur le protocole IP, l'identite d'une socket contient Fadresse IP de la 
machine et le numero de port employe. En fait, un processus ne devra obligatoirement identi- 
fier sa socket que s'il doit etre joint par un autre programme. Si le processus doit lui-meme 
contacter un serveur, il lui faut connaitre l'identite de l'autre extremite de la communication, 
mais 1' extremite locale sera automatiquement identified par le noyau. 

Pour stocker Fadresse complete d'une socket, on emploie la structure sockaddr, definie dans 
<sys/socket. h> et contenant les membres suivants : 



Nom 


Type 


Signification 


sa_fami ly 


unsigned short int 


Famille de communication 


sa_data 


char [] 


Donnees propres au protocole 



En realite, cette structure est une coquille vide, permettant d' employer un type homogene 
pour toutes les communications reseau. Pour indiquer veritablement l'identite d'une socket, 
on utilise une structure dependant de la famille de communication, puis on emploie une 
conversion de type (struct sockaddr *) lors des appels-systeme. 

Pour les sockets de la famille AF_I N ET reposant sur le protocole IP, la structure utilisee est 
sockaddr_in, definie dans <netinet/in.h> : 



Nom 


Type 




Signification 


sin_family 


short int 


Famille de communication AF_I NET. 


si n_port 


unsigned short 


Numero de port, dans I'ordre des octets du reseau. 


sin_addr 


struct in_addr 


Adresse IP de I'interface (dont le membre s_addr est dans I'ordre des 
octets du reseau). 


Nous ne les etudierons pas ici, mais on peut signaler que d'autres families de protocoles utili- 
sent les structures suivantes : 


Structure 


Fichier 


Famille 


Utilisation 


sockaddr_ax25 


<netax25/ax25. 


h> AF_AX25 


Radioamateurs 


sockaddr_in6 


<netinet/in.h> 


AF_I NET6 


IPv6 


sockaddr_ipx 


<netipx/ipx.h> 


AF_IPX 


Novell IPX 


sockaddr_un 


<sys/un . h> 


AFJJNIX 


Interne systeme Unix 
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Dans la plupart des appels-systeme ou on transmettra un pointeur sur une structure sockaddr_ 
in, converti en pointeur struct sockaddr *, il faudra aussi indiquer la taille de la structure 
sockaddr_in, obtenue grace a sizeof ( ). En effet, cette taille peut varier suivant les families de 
communication. 

Pour remplir les champs de la structure sockaddr_in, nous emploierons done la methode 
suivante : 

1. Mettre a zero tout le contenu de l'adresse, a l'aide de la fonction memset( ). 

2. Remplir le champ sin_family avec AF_INET. 

3. Remplir le champ sin_port avec le membre s_port d'une structure servent renvoyee par 
getservbyname( ) ou par getservbyport( ). 

4. Remplir le champ sin_addr avec le contenu du membre h_addr de la structure hostent 
renvoyee par gethostbyname( ) ou avec le retour de la fonction i net_aton( ). On convertit 
explicitement le type char * du membre h_addr en pointeur sur une structure in_addr afin 
de pouvoir copier son champ s_addr, qui est entier. Tout ceci deviendra plus clair dans les 
exemples a venir. 

Nous savons desormais creer une nouvelle socket et preparer la structure decrivant entiere- 
ment une adresse complete AF_INET. Nous pouvons maintenant examiner comment etablir la 
communication. 

Mentionnons auparavant l'existence d'un appel-systeme nomme socketpai r( ), permettant de 
creer en une seule fois deux sockets, a la maniere de pi pe( ) : 

int socketpair (int domaine, int type, int protocole, int sock [2]); 

Les deux descripteurs de socket sont stockes dans le tableau passe en quatrieme argument. A 
la difference de pipeO, les deux sockets sont bidirectionnelles. De plus, cet appel-systeme 
n'est disponible que dans le domaine AFJJNIX, que nous n'examinerons pas ici. Son interet est 
assez limite car il sert essentiellement a la transmission de descripteurs de fichiers ouverts 
entre processus. Ceci permet notamment a un serveur privilegie d'ouvrir des fichiers pour le 
compte de processus non privilegies qui lui en ont fait la demande, le controle des acces se 
faisant par une procedure interne au serveur, generalement plus complexe que les autorisa- 
tions gerees par le noyau. 

Affectation d'adresse 

Nous allons d'abord examiner comment affecter une identite a notre socket. Ceci s'effectue a 
l'aide de 1' appel-systeme bind( ) : 

int bind (int sock, struct sockaddr * adresse, socklen_t longueur); 

La socket representee par le descripteur passe en premier argument est associee a l'adresse 
passee en seconde position. En realite, on passe une adresse correspondant au domaine de la 
socket, par exemple un pointeur sur une structure sockaddr_in, converti en pointeur sockaddr *. 
Le noyau connaissant le type de la socket - precise lors de sa creation - assurera a son tour la 
conversion inverse. 

Le dernier argument represente la longueur de l'adresse. Cette valeur est indispensable, car 
avant d'analyser le type de la socket, le noyau doit copier l'adresse depuis l'espace de l'utili- 
sateur vers son propre espace memoire, et doit done connaitre la longueur reelle de la structure 
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en deuxieme position. Le type sockl en_t n'est pas disponible sur tous les Unix. Dans ce cas 
le troisieme argument est un entier int. 

Le schema habituel est done pour une socket en mode connecte : 
int 

cree_socket_stream (const char * nom_hote, 

const char * nom_service. const char * nom_proto) 

{ 

int sock; 

struct sockaddr_in adresse; 
struct hostent * hostent; 
struct servent * servent; 
struct protoent * protoent; 

if ((hostent = gethostbyname(nom_hote) ) == NULL) { 
perror( "gethostbyname" ) ; 
return -1; 

} 

if ((protoent = getprotobyname(nom_proto)) == NULL) ( 
perror( "getprotobyname" ) ; 
return -1; 

} 

if ((servent = getservbyname(nom_service, 

protoent->p_name) ) == NULL) { 
perror( "getservbyname" ) ; 
return -1; 

} 

if ((sock = socket(AF_INET, SOCK_STREAM, 0)) < 0) { 
perror( "socket" ) ; 
return -1; 

} 

memset(& adresse, 0, sizeof (struct sockaddr_in)) ; 
adresse sin_family = AF_I NET ; 
adresse. sin_port = servent->s_port; 
adresse. sin_addr . s_addr = 

((struct in_addr *) (hostent->h_addr) )->s_addr; 
if (bind(sock, (struct sockaddr *) & adresse, 

sizeof (struct sockaddr_in) ) < 0) { 
cl ose(sock) ; 
perrorCbind"); 
return -1; 

} 

return sock; 

} 

Notre socket est done creee et elle possede un nom. Nous allons voir dans les prochains para- 
graphes comment le serveur peut se mettre a l'ecoute en attendant que des processus le 
contactent. 

Lorsqu'on cree une socket situee du cote client, il n'est pas indispensable de mentionner 
explicitement notre identite. Le noyau attribuera de toute facon une adresse correcte lorsqu'on 
entrera en communication avec un autre processus. Si on desire quand meme se servir de 
bindt) de ce cote, on peut utiliser comme adresse la constante INADDR_ANY, definie dans 
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<netinet/in.h>, qui indique au noyau de choisir l'interface reseau adaptee pour la liaison 
avec le serveur (en fonction de ses tables de routage). De meme, on emploie un numero de 
port nul afin de demander au noyau de nous en attribuer un libre. 

L' initialisation se fait alors ainsi : 

memset(& adresse, 0, sizeof (struct sockaddr_in)) ; 

adresse.sin_family = AF_I NET ; 

adresse. sin_port = htons(O); 

adresse. sin_addr.s_addr = htonl ( INADDR_ANY) ; 

if (bind(... 

Remarquez que l'utilisation de htons ( ) n'est pas necessaire puisque le numero de port est nul. 
II en est de meme pour l'utilisation de htonl () car la constante INADDR_ANY correspond a 
l'adresse 0.0.0.0, c'est-a-dire 0x00000000. Toutefois il est preferable de les employer car on a 
souvent tendance en programmation reseau a copier-coller des portions de code, et a modifier 
uniquement les valeurs entre parentheses. Cette precaution evitera d' avoir a chercher ulterieu- 
rement un bogue difficile sur l'ordre des octets. 

L'appel-systeme bind( ) peut echouer en renvoyant -1, avec les conditions d'erreur suivantes : 



Norn 


Signification 


EBADF. EN0TS0CK 


Le descripteur de socket est invalide. 


EACCESS 


L'adresse demandee ne peut etre employee que par un processus ayant la capacite CAP_ 
N ET_B I N D_S E R V I C E . 


EINVAL 


La socket a deja une adresse ou elle est deja connectee, ou encore la longueur indiquee est 
inexacte. 


EADDRINUSE 


L'adresse est deja utilisee. 



L'erreur EADDRINUSE est souvent declenchee lorsqu'on redemarre un serveur qu'on vient 
d'arreter. Nous reviendrons en detail sur ce phenomene lorsque nous etudierons les options 
des sockets. 

II est possible egalement de rechercher l'adresse d'une socket. Ceci peut etre utile si elle a ete 
identifiee automatiquement par le noyau mais qu'on desire quand meme connaitre ses carac- 
teristiques, pour les fournir a l'utilisateur par exemple. 

L'appel-systeme getsockname( ) renvoie l'adresse d'une socket : 

int getsockname (int sock, struct sockaddr * adresse, 
socklen_t * longueur); 

Le second argument est un pointeur sur une structure correspondant au type de socket 
employee. Dans le domaine AF_I NET , on utilise une sockaddr_in en convertissant explicite- 
ment le pointeur. Le troisieme argument doit pointer sur une variable qui contient la longueur 
de cette structure. Au retour de la fonction, cette variable comprendra le nombre d' octets reel- 
lement ecrits. L'utilisation de getsockname ( ) se fait done ainsi : 

int 

aff i che_adresse_socket (int sock) 
{ 

struct sockaddr_in adresse; 
socklen_t longueur ; 
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longueur = sizeof (struct sockaddr_in) ; 

if (getsockname(sock, & adresse, & longueur) < 0) { 

perror( "getsockname" ) ; 

return -1; 

} 

fprintf (stdout, "IP = %s , Port = %u \n", 
inet_ntoa(adresse.sin_addr) , 
ntohs(adresse.sin_port) ) ; 

return 0; 

} 

De meme, lorsqu'une socket est connectee, il est possible d'obtenir des informations sur son 
correspondant en employant getpeername( ) : 

int getpeername (int sock, struct sockaddr * adresse, 
socklen_t * longueur); 

Cet appel-systeme fonctionne comme getsockname( ), mais il nous renseigne sur le correspon- 
dant distant. Ceci n'est possible qu'en mode connecte, lorsqu'une communication s'etablit de 
maniere organisee entre deux correspondants. Si la socket n'est pas connectee, elle peut avoir 
une multitude de correspondants successifs, puisqu'on pourra changer d'interlocuteur a 
chaque ecriture, et que tout un chacun pourra lui envoyer des donnees. 

Mode connecte et mode non connecte 

Lorsqu'on emploie des sockets fonctionnant en mode non connecte (SOCK_DGRAM dans le 
domaine AF_INET), le travail d' initialisation est deja termine. Le processus qui attend de rece- 
voir des requetes de la part d'autres programmes - appelons-le serveur - a identifie sa socket 
avec bi nd ( ) : elle est accessible de l'exterieur. Du cote des clients, 1' identification est etablie 
automatiquement par le noyau. Au contraire, pour une communication connectee, il reste 
encore du travail a accomplir, tant du cote serveur que du cote client. 

La difference essentielle entre les communications en mode connecte et celles en mode non 
connecte est que cette derniere technique necessite d'indiquer le destinataire du message a 
chaque envoi. Au contraire, lorsqu'une connexion est etablie, il n'y a plus que deux interlo- 
cuteurs face a face, et il n'y a pas d'ambiguite lors de remission ou de la reception d'un 
message. 

Lors d'une communication non connectee, on utilise les appels-systeme sendtoO et recv- 
f rom( ), qui permettent d'envoyer un paquet a destination d'un processus passe en argument 
ou de recevoir un paquet en recuperant 1' adresse de l'emetteur. Nous reviendrons plus loin sur 
ces primitives. Par contre, en mode connecte un processus peut utiliser send( ) et recv( ) , qui 
ne precisent pas F adresse du correspondant, ou meme read( ) et write ( ) comme avec un tube 
classique. 

II existe une bonne analogie qu'on retrouve souvent lorsqu'il s'agit de definir la notion de 
connexion. Pour faire parvenir des informations a un proche, nous pouvons utiliser soit le 
telephone, soit le service postal 1 . 

• Pour communiquer par telephone nous devons etablir la liaison en appelant notre corres- 
pondant. Celui-ci decroche et nous nous identifions mutuellement. Le respect de ce protocole 



1. On peut aussi envoyer un e-mail, mais cela revient exactement au meme principe que l'acheminement postal. 
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nous permet de dialoguer en mode connecte. Tant que nous n'avons pas raccroche, il est 
possible d'envoyer des informations sans avoir besoin de preciser le destinataire. Si une 
interference se produit, notre correspondant nous demande de repeter la phrase. La 
communication en mode connecte nous garantit ici que les messages seront bien delivres a 
notre interlocuteur, indemnes et dans Fordre. Le telephone et ses tonalites caracteristiques 
(attente, occupe, raccroche), associes a un protocole comportant quelques mots standard 
« Alio ? », « Pardon, pouvez-vous repeter ? », « Au revoir ! », est un service de communi- 
cation fiable. 

• Lorsqu'on envoie des messages par la poste, nous devons ecrire l'adresse du correspondant 
sur chaque enveloppe. Celui-ci regarde regulierement dans sa boite et peut y decouvrir 
simultanement des lettres provenant de plusieurs emetteurs. Pourrepondre a notre courrier, 
il lui faudra ecrire une nouvelle lettre et la cacheter en inscrivant notre adresse de retour sur 
1' enveloppe. II n'y a pas de connexion etablie, Fidentite du destinataire doit etre indiquee 
dans chaque message. Rien ne garantit non plus que les messages nous parviendront dans 
Fordre ni meme qu'ils arriveront un jour. Si une lettre est detrempee par la pluie et quasi 
illisible, notre correspondant devra nous contacter et nous demander de lui reecrire le 
message. Ceci n'est pas compris dans le protocole mais se trouve dans la couche applica- 
tive de la communication. La poste propose un service de communication non connecte, 
non fiable. 

Dans le domaine AF_I NET, les communications connectees (TCP) sont fiables, alors que les 
non-connectees (UDP) ne le sont pas. Ceci n'est toutefois pas une regie absolue, car des 
methodes de controle et de sequencement peuvent etre associees a un protocole sans 
connexion pour le fiabiliser encore plus. Pour continuer notre analogie, F envoi de lettres 
postales en recommande avec accuse de reception transforme ce service en communication 
non connectee fiable, mais avec un surcout sensible. 

Nous allons examiner a present la fin de Finitialisation d'une communication en mode 
connecte avant d'analyser Futilisation proprement dite de la socket, pour envoyer ou recevoir 
des donnees. 

Attente de connexions 

Nous allons tout d'abord nous interesser a un serveur acceptant des connexions. Dans notre 
domaine AF_INET, il s'agira done d'un serveur TCP. Supposons que nous desirions ecrire une 
application fonctionnant comme un demon, a la maniere d'un serveur FTP, TELNET, finger, 
etc. 1 Notre application doit tout d'abord creer une socket de communication TCP, puis lui 
associer l'adresse IP et le numero de port sur lesquels les clients tenteront de la contacter. On 
peut pour cela utiliser la routine cree_socket_stream( ) que nous avons ecrite plus haut. 
On peut Fameliorer en autorisant le pointeur sur le nom d'hote a etre NULL, dans ce cas on 
emploie une adresse I NADDR_ANY. Le pointeur sur le nom de service peut aussi etre NULL, ce qui 
signifie qu'on demande au noyau de nous attribuer un port en indiquant un numero zero : 

if ((sock = cree_socket_stream(NULL, NULL, "tcp")) < 0) 
exit(EXIT_FAILURE); 



1. En fait, tous ces serveurs generaux du systeme fonctionnent un peu differemment en utilisant les services de inetd, 
comme nous le verrons ulterieurement. 
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II faudra recuperet - l'adresse de notre socket a Faide de la fonction ecrite dans la section 
precedente pour connaitre le numero de port que les clients devront contacter. 

Ensuite, nous devrons indiquer au noyau que nous attendons des connexions sur cette socket. 
Ceci s'effectue en appelant l'appel-systeme 1 isten( ) : 

int listenO'nt sock, int nb_en_attente) ; 

Le second argument de cet appel-systeme demande au noyau de dimensionner une file 
d'attente des requetes de connexions. Si une demande de connexion arrive et si le serveur est 
occupe, elle sera mise dans une file. Si la file est pleine, les nouvelles connexions seront 
rejetees. En general, on emploie la constante 5 car c'etait la limite dans 1' implementation 
originale des sockets BSD, mais Linux accepte une file contenant jusqu'a 128 connexions en 
attente. 



Attention 

N'attachez pas trop d'importance a ce parametre. II sert simplement a dimensionner la tolerance du systeme 
lorsque plusieurs demandes arrivent simultanement. Ce n'est significatif que pour des serveurs acceptant de 
tres nombreuses requetes avec un rythme eleve (serveur HTTP par exemple). 



Lappel li stent) n'est pas bloquant, il revient immediatement. Les erreurs eventuelles 
concernent uniquement les descripteurs de socket invalides ou les tentatives d'utilisation de 
1 i sten( ) sur des sockets fonctionnant en mode non connecte. 

Une fois que le noyau est informe que le processus desire recevoir des connexions, il faut 
mettre effectivement le programme en attente. Pour cela on invoque l'appel-systeme accept( ) : 

int accept (int sock, struct sockaddr * adresse, socklen_t * longueur); 

Nous allons atteindre ici un point subtil de la programmation reseau, necessitant un peu 
d' attention. Lorsqu'on cree un serveur TCP, on veut pouvoir recevoir des connexions en 
provenance de plusieurs clients. Et de surcroit, de facon simultanee. La socket que nous avons 
creee est attachee a une adresse IP et a un numero de port connus des clients. II s'agit done 
d'une socket servant a etablir le contact. Toutefois, on ne peut pas se permettre de la monopo- 
liser ensuite pour assurer reellement la communication. Imaginons un serveur FTP qui a 
installe sa socket sur le port 21 de l'interface reseau de la machine. Un correspondant contacte 
notre serveur sur ce port et la connexion s'etablit. Neanmoins, il est hors de question de 
bloquer ce port pour transferer toutes les donnees que notre correspondant desire, car aucun 
autre client ne pourrait nous contacter pendant ce temps. 

Le principe de l'appel-systeme accept( ) est done de prendre une demande de connexion en 
attente - dans la file dimensionnee avec 1 i sten ( ) -, puis d'ouvrir une nouvelle socket du cote 
serveur et d'etablir la connexion sur celle-ci. La socket originale, celle qui a ete passee en 
argument, reste done intacte, prete a servir a nouveau pour une demande de connexion. La 
nouvelle socket creee est renvoyee par acceptt ). Le processus emploiera done celle-ci pour 
toute la communication ulterieure. 

Les deuxieme et troisieme arguments de acceptO fonctionnent comme ceux de getpeer- 
name( ) et fournissent l'identite du client. 

La plupart du temps, un serveur veut pouvoir dialoguer avec plusieurs clients simultanement. 
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Pour cela le plus simple est d'invoquer fork( ) au retour de accept( ), et de laisser le processus 
fils traiter la communication, alors que le pere retourne en attente sur accept ( ). Voici un tel 
schema : 

int 

serveur_tcp (void) 
f 

int sock_contact; 
int sock_connectee; 
struct sockaddr_in adresse; 
socklen_t longueur; 

sock_contact = cree_socket_stream(NULL, NULL, "tcp"); 
if (sock_contact < 0) 

return -1; 
1 isten(sock_contact, 5); 
fprintf (stdout, "Mon adresse >> "); 
affiche_adresse_socket(sock_contact) ; 
while (! quitter_le_serveur()) { 

longueur = sizeof (struct sockaddr_in) ; 
sock_connectee = accept(sock_contact, 

(struct sockaddr *)& adresse, & longueur); 
if (sock_connectee < 0) ( 
perrorC'accept"); 
return -1; 

} 

switch (forkO) { 

case 0 : /* fils */ 

cl ose(sock_contact) ; 

traite_connexion(sock_connectee) ; 

exit(EXIT_SUCCESS); 
case -1: 

perrorCfork") ; 

return -1; 
default : /* pere */ 

cl ose(sock_connectee) ; 

} 

} 

return 0; 

} 

On notera que les processus fils qui se terminent deviennent zombies, car leur processus pere 
ne lit pas les codes de retour. Pour eviter cette situation, on peut eventuellement ajouter une 
ligne : 

signal (SIGCHLD, SIG_IGN); 

ou - mieux - installer un petit gestionnaire pour le signal SIGCHLD. 
L'exemple suivant va utiliser les routines developpees ci-dessus. 

La routine qui tter_l e_serveur( ) renvoie toujours zero ; nous arreterons le processus avec 
Controle-C. Le travail du processus fils consiste a determiner F adresse de son correspondant 
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a l'aide de getpeername( ), a afficher les adresses des deux extremites de la socket, et a trans- 
mettre avec write ( ) sa propre adresse au correspondant. Le programme est done : 

exemple_serveur tcp.c : 

#include <stdio.h> 
#include <unistd.h> 

#include <arpa/inet.h> 
#include <netdb.h> 
#include <netinet/in.h> 

#include <sys/types.h> 
#include <sys/socket. h> 

int cree_socket_stream (const char * nomjiote, 



[ ... ] 

void 

traite_connexion (int sock) 
{ 

struct sockaddr_in adresse; 
socklen_t longueur; 
char buffer[256]; 

longueur = sizeof (struct sockaddr_in) ; 

if (getpeername(sock. (struct sockaddr *)& adresse, & longueur) < 0) { 
perror( "getpeername" ) ; 
return; 

} 

sprintf (buffer, "IP = %s. Port = %u \n", 

inet_ntoa(adresse.sin_addr) , 

ntohs(adresse.sin_port) ) ; 
fprintf (stdout, "Connexion : locale "); 
affiche_adresse_socket(sock) ; 
fprintf (stdout, " distante %s" , buffer); 

writetsock, "Votre adresse : ", 16); 
writetsock, buffer, strlen(buffer) ) ; 
cl ose(sock) ; 



int 

main (int argc, char * argv[]) 
{ 

return serveur_tcp (); 

} 



int aff i che_adresse_socket 

int serveur_tcp 

int quitter_l e_serveur 

void traite_connexion 



const char * nom_service, 

const char * nom_proto) ; 

(int sock); 

(void) ; 

(void) ; 

(int sock) ; 
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Avant de tester ce programme, je voudrais ajouter un mot concernant les fichiers d'en-tete 
inclus dans les logiciels utilisant les sockets. On l'a vu, ces fichiers definissent un grand 
nombre de structures dependant les unes des autres et des macros pour acceder a leurs diffe- 
rents champs. Sous Linux, F organisation des fichiers est telle que Fordre d' inclusion n'a pas 
d'importance. Par contre, sur d' autres systemes cet ordre est crucial, car la moindre inversion 
peut declencher des cascades d'avertissements du compilateur, voire des echecs de compila- 
tion. La liste des fichiers d'en-tete inclus dans le programme ci-dessus ainsi que leur ordre 
represented ce qui me semble, empiriquement, le plus portable sur d' autres Unix. 

Pour nous connecter au serveur, nous utiliserons le programme telnet en lui indiquant en 
argument le numero de port que le programme affiche au demarrage. Nous allons presenter le 
serveur sur la partie gauche de l'ecran et les clients sur la moitie droite. Les deux premieres 
connexions ont lieu depuis la meme machine que le serveur, la troisieme depuis une autre 
station. La premiere connexion emploie l'adresse loopback 127.0.0.1, alors que les autres 
passent par l'interface reseau de cette machine 192.1.1.51. La constante I NADDR_ANY qui est 
utilisee comme adresse pour le serveur a pour valeur 0 . 0 . 0 . 0, ce qui correspond a une ecoute 
sur toutes les interfaces disponibles. 

$ ./exemple_serveur_tcp 

Mon adresse » IP = 0.0.0.0, Port = 1605 



$ telnet localhost 1605 

Trying 127.0.0.1. . . 
Connected to localhost. 
Escape character is '*]'. 



Connexion : locale IP = 127.0.0.1, Port = 1605 
distante IP = 127.0.0.1, Port = 1606 



Votre adresse : IP = 127.0.0 
Connection closed by foreign 
$ 



1, Port = 1606 
host. 



$ telnet 192.1.1.51 1605 
Trying 192.1.1.51... 
Connected to 192.1.1.51. 
Escape character is * A ]'. 



Connexion : locale IP = 192.1.1.51, Port = 1605 
distante IP = 192.1.1.51, Port = 1607 



Votre adresse : IP = 192.1.1 
Connection closed by foreign 
$ 



51, Port = 1607 
host. 



$ telnet 192.1.1.51 1605 
Trying 192.1.1.51... 
Connected to 192.1.1.51. 
Escape character is ,A ]*. 



Connexion : locale IP = 192.1.1.51, Port = 1605 
distante IP = 192.1.1.61, Port = 1025 



Votre adresse : IP = 192.1.1 
Connection closed by foreign 
$ 



61, Port = 1025 
host. 



(Controle-C) 

$ 



Utilisation des sockets 

Chapitre 32 



Un programme peut avoir besoin d'attendre des connexions simultanement sur plusieurs 
sockets de contact - par exemple sur plusieurs ports. Or, acceptO est un appel-systeme 
bloquant. II est done possible d'utiliser auparavant selectO, en attendant Farrivee de 
donnees en lecture sur toutes les sockets surveillees. Les donnees recues correspondront a une 
demande de connexion, et on pourra alors appeler accept( ) en sachant qu'on ne restera pas 
bloque. 

Demander une connexion 

Nous allons a present nous interesser a la socket situee du cote client, en etudiant F appel- 
systeme connect( ). 

int connect (int sock, struct sockaddr * adresse, socklen_t longueur); 

Celui-ci fonctionne de maniere evidente, en contactant le serveur dont F adresse est passee en 
argument et en etablissant la connexion sur la socket indiquee. Nous pouvons F employer 
pour creer un petit utilitaire, tcp_2_stdout, qui se connecte sur un serveur TCP et recopie tout 
ce qu'il recoit sur sa sortie standard. II acceptera les options -a et -p servant a indiquer 
respectivement F adresse et le numero de port du serveur. Nous creerons done une routine 
analysant les arguments en ligne de commande et remplissant une structure sockaddr^in, afin 
de pouvoir la reutiliser dans d'autres programmes. 

int 

lecture_arguments (int argc, char * argv [], 

struct sockaddr_in * adresse, char * protocole) 

{ 

char * liste_options = "a:p:h"; 

int option; 

char * hote = "local host"; 

char * port = "2000"; 

struct hostent * hostent; 

struct servent * servent; 

int numero; 

while ((option = getopt(argc, argv, 1 iste_options) ) != -1) { 
switch (option) { 
case 'a' : 

hote = optarg; 
break; 
case 'p' : 

port = optarg; 
break; 
case 'h' : 

fprintf (stderr, "Syntaxe : %s [-a adresse] [-p port] \n", 
argv[0]); 

return -1; 
default : 
break; 

} 

} 

memset(adresse, 0, sizeof (struct sockaddr_in) ) ; 
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if (inet_aton(hote, & (adresse->sin_addr) ) == 0) { 
if ((hostent = gethostbyname(hote) ) == NULL) ( 
fprintf (stderr, "note %s inconnu \n", hote); 
return -1; 

} 

adresse->sin_addr.s_addr = 

((struct in_addr *) (hostent->h_addr) )->s_addr; 

} 

if (sscanf (port, "%d" , & numero) == 1) { 
adresse->sin_port = htons(numero) ; 
return 0; 

} 

if ((servent = getservbyname(port, protocole)) == NULL) { 
fprintf (stderr, "Service %s inconnu \n", port); 
return -1; 

} 

adresse->sin_port = servent->s_port; 
return 0; 

} 

Le client TCP devient done simplement : 
tcp_2_stdout.c : 

#include <stdio.h> 
//include <unistd.h> 

#include <arpa/inet.h> 
#include <netdb.h> 
#include <netinet/in.h> 
#include <sys/types.h> 
#include <sys/socket.h> 

//define LG_BUFFER 1024 

int 1 ecture_arguments (int argc, char * argv [], 

struct sockaddr_in * adresse, char * protocole); 

int 

main (int argc, char * argv[]) 
{ 

int sock; 

struct sockaddr_in adresse; 

char buffer[LG_BUFFER] ; 

int nb_lus; 

if (lecture_arguments(argc, argv, & adresse, "tcp") < 0) 

exit(EXIT_FAILURE); 
adresse. sin_family = AF_I NET ; 

if ((sock = socket(AF_INET, S0CK_STREAM. 0)) < 0) { 
perrort "socket" ) ; 
exit(EXIT_FAILURE); 
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if (connecttsock, (struct sockaddr *) & adresse, 
sizeof (struct sockaddr_in) ) < 0) { 
perrorC'connect"); 
exi t( EXIT_FAI LURE) ; 

} 

setvbuf(stdout, NULL, _I0NBF, 0); 
while (1) { 

if ((nbjus = read(sock, buffer, LG_BUFFER) ) == 0) 

break; 
if (nbjus < 0) { 

perror( "read" ) ; 

exi t(EXIT_FAI LURE); 

} 

write(STDOUT_FILEN0, buffer, nbjus); 

} 

return EXIT_SUCCESS; 

} 

L'appel read( ) renvoie zero lorsque la communication est coupee, et -1 en cas d'erreur, ce 
qui explique les deux cas traites dans la boucle. On remarque que le buffer de sortie de stdout 
a ete supprime avec setvbufO. Ceci sert principalement lorsque cet utilitaire est employe 
pour transferer des donnees binaires, afin qu'elles soient transmises au processus en aval au 
rythme de leur arrivee depuis le reseau 1 . 

L' execution de ce programme donne les memes resultats que ce que nous observions avec 
tel net : 

$ ./exemple_serveur_tcp 

Mon adresse >> IP = 0.0.0.0, Port = 1628 

$ ./tcp_2_stdout -p 1628 
Connexion : locale IP = 127.0.0.1, Port = 1628 
distante IP = 127.0.0.1, Port = 1634 

Votre adresse : IP = 127.0.0.1, Port = 1634 

$ 

$ ./tcp_2_stdout -p 1700 

connect: Connexion refusee 
$ 

(Controle-C) 

$ 

Nous constatons lors de la seconde invocation que l'appel-systeme connect( ) echoue s'il n'y 
a pas de serveur sur le port indique. On peut tres bien utiliser ce programme pour se connecter 
sur des services du systeme : 

$ ./tcp_2_stdout -p daytime 

Thu Mar 16 13:26:09 2000 
$ ./tcp_2_stdout -p nntp 



1. Comme je l'ai deja mentionne dans un autre chapitre, j'ai deja utilise professionnellement les utilitaires de transfert 
entre le reseau et stdi n ou stdout developpes ici. Durant des phases de debogage ou de prototypage d' applications aero- 
portuaires, ils me servaient a transporter et a convertir des donnees provenant de radars vers des applications de visualisa- 
tion. II ne s'agit done pas d'exemples totalement artificiels. 



854 



Programmation systeme en C sous Linux 



200 Leafnode NNTP Daemon, version 1.9.10 running at venux.ccb.fr 
(Controle-C) 

$ 

Lorsque nous etablissons la connexion avec le demon nntp, il nous faut ensuite la couper 
manuellement avec Controle-C car chaque programme est en attente de donnees provenant de 
1' autre processus. 

Le service daytime est implements directement dans le demon superserveur /usr/sbi n/i netd. 
II renvoie simplement la date et l'heure du systeme. Nous pouvons en implementer une 
version tres facilement en modifiant le programme exemple_tcp_serveur.c pour qu'il utilise 
la routine suivante : 

void 

traite_connexion (int sock) 
{ 

char buffer [256]; 
time_t heure; 

heure = time(NULL) ; 

sprintf (buffer, "%s" , ctime(& heure)); 
write(sock, buffer, strl en(buffer) ) ; 
cl ose(sock) ; 

} 

Bien entendu, pour un veritable serveur systeme il faudrait employer le numero de port appro- 
prie, 13 en F occurrence. On peut verifier que ce serveur se comporte comme F original : 

$ ./exemple_serveur_daytime 

Mon adresse » IP = 0.0.0.0, Port = 1665 

$ telnet localhost 1665 

Trying 127.0.0.1. . . 

Connected to localhost. 

Escape character is '*]'. 

Thu Mar 16 14:27:29 2000 

Connection closed by foreign host. 

$ 

$ telnet localhost daytime 

Trying 127.0.0.1. . . 

Connected to localhost. 

Escape character is '*]'. 

Thu Mar 16 14:27:32 2000 

Connection closed by foreign host. 

$ 

(Controle-C) 

$ 

L'appel-systeme connect( ) peut aussi etre employe sur des sockets UDP. Cela sert a indiquer 
au noyau que nous desirons dialoguer sur cette socket exclusivement avec le correspondant 
indique en argument. II sera alors possible d'utiliser directement read( ) et write( ), ou recv( ) 
et sendO, sans avoir besoin de s'occuper a nouveau de Finterlocuteur. Le noyau dirigera 
toutes nos ecritures vers F adresse et le port indiques. Parallelement, tous les messages ne 
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provenant pas de ce correspondant seront elimines par le noyau. Ceci permet de filtrer la 
communication lorsqu'on ne veut pas etre derange par d'autres processus. L'utilisation de 
connect( ) sur une socket UDP presente aussi l'avantage de pouvoir mieux gerer les erreurs 
grace au protocole ICMP, comme nous le verrons plus bas. 



Attention 

La connexion d'une socket UDP n'est qu'une operation interne au processus et au noyau. Ce dernier memo- 
rise I'adresse du correspondant preferentiel, mais aucun dialogue reseau n'a lieu. L'interlocuteur n'est aucu- 
nement concerne par cette action. 



Fermeture d'une socket 

Pour refermer une socket, on emploie en general l'appel-systeme close( ), qui est adapte a 
tous les descripteurs de fichiers sous Unix. Cette primitive est automatiquement invoquee 
lorsqu'un processus se termine. La socket est done refermee et devient inutilisable. 

Toutefois, avec un protocole connecte, il se peut que certaines donnees n'aient pas encore ete 
transmises ou que 1' accuse de reception ne soit pas encore arrive. Si des donnees sont toujours 
en train de circuler sur le reseau, elles peuvent arriver endommagees et le destinataire peut 
nous demander de les repeter. Le protocole etant fiable, il doit garantir la bonne transmission 
des donnees, meme si le processus s'est termine juste apres les avoir ecrites. 

La fermeture immediate d'une communication TCP n'est done pas possible. La terminaison 
est une operation a part entiere du protocole, necessitant des acquittements complets des deux 
correspondants. Cela signifie que la fermeture d'une socket TCP n'a pas de repercussion 
immediate sur les interfaces reseau du noyau. La socket continue d'exister pendant un certain 
temps, afin de s' assurer que toutes les donnees restantes ont ete transmises. Cette socket est 
encore visible avec l'utilitaire netstat. Si on essaye de reutiliser immediatement I'adresse en 
relancant le processus, bind( ) nous renvoie l'erreur EADDRINUSE. 

Pour en avoir le cceur net, nous pouvons creer un programme qui ouvre une socket serveur 
TCP, attend une connexion et la referme immediatement. Ensuite, ce processus va essayer 
d'invoquer bindO, en bouclant jusqu'a ce qu'il reussisse. II nous affichera alors la duree 
ecoulee. 

delai_close.c : 

#include <errno.h> 
#include <stdio.h> 
#include <time.h> 
#include <unistd.h> 
#include <arpa/inet.h> 
#include <netdb.h> 
#include <netinet/in.h> 
#include <sys/types.h> 
#include <sys/socket. h> 

int lecture_arguments (int argc, char * argv [], 

struct sockaddr_in * adresse, char * protocole); 



856 



Programmation systeme en C sous Linux 



int 

main (int argc, char * argv[]) 
{ 

int sock; 
struct sockaddr_in adresse; 
time_t debut; 
time_t fin; 

if (lecture_arguments(argc, argv, & adresse, "tcp") < 0) 

exit(EXIT_FAILURE); 
adresse . sin_family = AF_I NET ; 
if ((sock = socket(AF_INET, S0CK_STREAM, 0)) < 0) { 

perror( "socket" ) ; 

exit(EXIT_FAILURE); 

} 

if (bindtsock, & adresse, sizeof (struct sockaddr_in) ) < 0) { 
perror("bind"); 
exit(EXIT_FAILURE); 

} 

listen(sock, 5); 

cl ose(accept(sock, NULL, 0)); 

cl ose(sock) ; 

if ((sock = socket(AF_INET, S0CK_STREAM, 0)) < 0) { 
perror( "socket" ) ; 
exit(EXIT_FAILURE); 

} 

time(& debut) ; 
while (1) { 

if (bindtsock, (struct sockaddr *) & adresse, 
sizeof (struct sockaddr_in) ) == 0) 

break; 

if (errno != EADDRINUSE) { 
perrorC'bind 2"); 
exit(EXIT_FAILURE) ; 

} 

sleep(l); 

} 

time(& fin) ; 

fprintf (stdout, "Duree de persistance apres fermeture : £ld \n", 

fin - debut); 

return EXIT_SUCCESS; 

} 

Le comptage ne commence que lorsque la premiere socket est refermee, c'est-a-dire apres la 
fin du tel net execute sur un autre terminal. On profite du delai pour observer la socket avec 
netstat. 

$ ./delai_close -a 192.1.1.51 -p 1234 

$ telnet 192.1.1.51 1234 

Trying 192.1.1.51... 
Connected to 192.1.1.51. 
Escape character is '*]'. 
Connection closed by foreign host. 
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$ netstat -t 

Connexions Internet actives (sans serveurs) 

Proto Recv-Q Send-Q Adr. locale Adr.dist. 

tcp 0 0 venux:1234 venux:1671 
$ 



Etat 



TIME_WAIT 



(1 minute plus tard) 



Duree de persistance apres fermeture : 60 
$ 



L'etat TIME_WAIT indique par netstat correspond a l'attente integree dans le protocole TCP. 
Nous voyons qu'avec ce noyau (Linux 2.2), les sockets TCP persistent pendant une minute 
apres leur fermeture. Nous verrons plus loin comment demander a reutiliser immediatement 
une adresse, afin de pouvoir relancer un serveur sans attendre pendant une minute. 

II existe un appel-sy steme nomme s h utdown ( ) , permettant de controler plus finement la fin de 
Futilisation d'une socket : 

I int shutdown (int sock, int mode); 

Si on appelle cette routine avec un second argument nul, la socket ne permettra plus de rece- 
voir de donnees. Si cet argument vaut 1, shutdownO interdit remission de donnees sur la 
socket, et un argument valant 2 est equivalent a cl ose( ). L' utilisation typique de cette primi- 
tive est la suivante : 

1. Nous envoyons des donnees a un serveur TCP. II s'agit d'un flux d'octets, dont la longueur 
est arbitraire (done le serveur ne peut pas determiner leur fin). Une fois que toutes les 
informations ont ete envoyees, nous fermons le cote ecriture de la socket avec shutdown 
(sock, 1). 

2. Les appels-systeme read( ) invoques sur le serveur renverront 0 des que les donnees auront 
toutes ete envoyees et que nous aurons appele shutdown ( ). Sachant que toutes les informa- 
tions sont arrivees, le serveur peut les traiter et nous envoyer la reponse. A la fin de la 
reponse, le serveur ferme sa socket (et le processus fils se termine). 

3. Le client peut lire la reponse car sa socket n'est pas fermee en lecture. Quand toute la 
reponse aura ete recue, nos appels read( ) renverront 0. On pourra alors fermer la socket 
totalement. 

L'appel-systeme shutdownO ne peut etre utilise que sur une socket connectee. 



Pour envoyer ou recevoir des donnees, nous avons jusqu'a present utilise writet ) et read( ), 
car d'une part nous connaissions deja ces fonctions et d' autre part nos programmes fonction- 
naient en mode connecte avec TCP. Si nous choisissons UDP, il nous faut employer des 
routines plus generales, permettant d' avoir acces a l'identite de l'interlocuteur. Les fonctions 
recvf rom( ) et sendto( ) remplissent ce role : 

int reevfrom (int sock, char * buffer, int taille_buffer, int attributs, 

struct sockaddr * source, socklen_t * taille); 
int sendto (int sock, char * buffer, int taille_buffer, int attributs, 

struct sockaddr * source, socklen_t taille); 



Recevoir ou envoyer des donnees 
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La seule difference entre ces deux prototypes est le dernier argument. II s'agit d'un pointeur 
dans le cas de recvfromO et d'une valeur dans le cas de sendtoO. Les autres arguments 
correspondent a la socket employee, au buffer a transmettre ou a remplir, ainsi qu'a sa taille et 
a des attributs que nous detaillerons plus bas. Les deux derniers arguments de finis sent une 
adresse et sa taille. 

Dans le cas de recvf rom( ), la structure sockaddr transmise est remplie lors de l'appel-systeme 
avec Fadresse de l'emetteur du message lu. Si ce pointeur est NULL, il est ignore. 

Dans le cas de sendtoO, la structure sockaddr doit contenir l'adresse du destinataire du 
message. Si la socket est connectee, ce pointeur peut etre NULL. 

II existe d'ailleurs deux fonctions plus courtes, send( ) et recv( ) , equivalentes de sendtot ) et 
recvf rom( ) avec des pointeurs d'adresse NULL. 

int send (int sock, char * buffer, int taille_buffer, int attributs); 
int recv (int sock, char * buffer, int taille_buffer, int attributs); 

Lappel send( ) ne peut etre utilise qu'avec une socket connectee (en TCP ou en UDP). II faut 
en effet que le noyau connaisse l'adresse du correspondant. La primitive recvO peut par 
contre etre employee aussi sur une socket non connectee, encore que ce soit inhabituel - si on 
ne desire pas connaitre l'adresse de l'emetteur et si on ne veut done pas lui repondre. 

Les valeurs les plus frequentes qu'on peut associer par un OU binaire dans le champ attri - 
buts sont les suivantes : 





Norn 


Signification 


MSG_ 


.DONTROUTE 


Cette option sert surtout a deboguer les communications sur un reseau. Elle permet de negliger 
les procedures de routage mises en service par le noyau et de diriger directement le message 
vers I'interface qui correspond au sous-reseau de l'adresse du destinataire. Ne sert qu'avec 
sendto( ) ou send( ). 


MSG_ 


_00B 


Le message doit etre considere comme des donnees TCP hors bande. Elles sont emises avec 
une priorite superieure a celle des informations normales. Au niveau du recepteur, elles seront 
regues sans passer par une file d'attente. Suivant la configuration de la socket, il peut etre 
necessaire d'utiliser cette option pour lire les donnees hors bande . 


MSG_ 


.PEEK 


Lire les donnees desirees sur une socket TCP, sans les extraire de la file d'attente. Ne sert 
qu'avec recvfrom( ) ou recv( ). 



II peut exister d' autres options specifiques au noyau. Comme on le voit, la plupart du temps 
on n'utilise pas ces valeurs. II est alors possible d'employer directement write( ) et read( ), 
qui sont exactement equivalents a send( ) et recv( ) avec des arguments attributs nuls. Ces 
routines ont l'avantage d'etre utilisables sur tout type de descripteurs, depuis les fichiers 
speciaux de peripheriques aux sockets, en passant par les fichiers normaux, les tubes, etc. 

II faut signaler l'existence de deux appels-systeme tres puissants mais assez complexes, 
sendmsgO et recvmsgO. Ceux-ci utilisent des structures permettant de regrouper plusieurs 
lectures ou plusieurs ecritures, a la maniere de readv( ) et de writev( ). lis permettent egale- 
ment de transmettre un descripteur de fichier ouvert entre processus. Ces operations sortent 
des limites de notre propos, qui est simplement d'expliquer comment faire communiquer des 
processus repartis. 
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Lorsqu'un processus tente d'ecrire sur une socket n'ayant pas d'interlocuteur, le signal 
S I G P I P E est declenche. On aura habituellement tout interet a 1' ignorer, car dans ce cas F appel- 
systeme concerne - writet ), recv( )ou recvf rom( ) - renverra une erreur EPIPE, plus facile a 
traiter dans le cours du programme que de maniere asynchrone dans un gestionnaire de 
signaux. 

Lorsque la lecture se fait sur une socket connectee dont le correspondant a ferme 1' autre extre- 
mite, l'appel-systeme renvoie une valeur nulle. Si on utilise selectO sur une socket en 
lecture et si Finterlocuteur la referme de son cote, cet appel-systeme signale que des donnees 
sont disponibles en lecture. Ceci est du a Farrivee d'un caractere EOF. La lecture suivante 
renverra zero octet. 

Pour observer un peu recvf rom( ) et sendto( ) sur des sockets UDP, nous allons creer deux 
utilitaires : udp_2_stdout , qui permet de recevoir des donnees sur un port UDP et de les trans- 
mettre sur sa sortie standard, et en parallele stdin_2_udp, qui sert a dinger des donnees vers 
un serveur en ecoute. 

stdin_2_udp.c : 

#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 

#include <arpa/inet.h> 

#include <netdb.h> 

#include <netinet/in.h> 

#include <sys/types.h> 

#include <sys/socket. h> 

#define LG_BUFFER 1024 

int lecture_arguments (int argc, char * argv [], 

struct sockaddr_in * adresse, char * protocole); 

int 

main (int argc, char * argv[]) 
{ 

int sock; 

struct sockaddr_in adresse; 

char buffer[LG_BUFFER]; 

int nb_lus; 

if (lecture_arguments(argc, argv, & adresse, "udp") < 0) 

exit(EXIT_FAILURE); 
adresse. si n_f ami ly = AF_I NET ; 

if ((sock = socket(AF_INET, S0CK_DGRAM, 0)) < 0) { 
perror( "socket" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

while (1) { 

if ((nbjus = read(STDIN_FILENO, buffer, LG_BUFFER) ) == 0) 
break; 



860 



Programmation systeme en C sous Linux 



if (nbjus < 0) { 
perror( "read" ) ; 
break; 

} 

sendto(sock, buffer, nb_lus, 0, 

(struct sockaddr *) & adresse, sizeof (struct sockaddr_in) ) ; 

} 

return EXIT_SUCCESS; 

} 

udp_2 stdout.c : 

int 

main (int argc, char * argv[]) 
{ 

int sock; 

struct sockaddr_in adresse; 

char buffer[LG_BUFFER] ; 

int nb_lus; 

if (lecture_arguments(argc, argv, & adresse, "udp") < 0) 

exit(EXIT_FAILURE); 
adresse. sin_family = AF_I NET ; 

if ((sock = socket(AF_INET, S0CK_DGRAM, 0)) < 0) { 
perror( "socket" ) ; 
exit(EXIT_FAILURE); 

} 

if (bindtsock, & adresse, sizeof (struct sockaddr_in) ) < 0) { 
perror("bind"); 
exit(EXIT_FAILURE); 

} 

setvbuf(stdout, NULL, _I0NBF, 0); 
while (1) { 

if ((nbjus = recv(sock, buffer, LG_BUFFER, 0)) == 0) 

break; 
if (nbjus < 0) { 

perror( "read" ) ; 

break; 

} 

write(STD0UT_FILEN0, buffer, nbjus); 

} 

return EXITJUCCESS; 

} 

On notera que 1" adresse et le numero de port indiques en arguments doivent dans les deux 
cas correspondre au processus recepteur. Nous pouvons essayer ces applications en lancant 
simultanement deux stdinj?_udp et un udpJ?_stdout. L'enchainement n'est pas tres facile a 
representer : 

$ ./udp_2_stdout -a 192.1.1.51 -p 1234 

$ ./stdin_2_udp -a 192.1.1.51 -p 1234 

$ ./stdin_2_udp -a 192.1.1.51 -p 1234 
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Premiere chaine depuis station 1 

Premiere chaine depuis station 1 

Premiere chaine depuis station 2 
Premiere chaine depuis station 2 

Deuxieme chaine, depuis station 1 
Deuxieme chaine, depuis station 1 

(Controle-C) 

$ 

Deuxieme chaine, depuis station 2 

Deuxieme chaine, depuis station 2 

(Controle-C) 
$ 

(Controle-C) 
$ 

Nous n'avons pas utilise jusqu'a present l'aspect bidirectionnel des sockets. Nous allons 
maintenant le mettre en ceuvre en creant un serveur TCP qui recoit des chaines de caracteres 
emises par un client, les traite et les renvoie au meme client qui les affiche. Pour avoir quelque 
chose a faire avec les chaines, nous allons a nouveau creer une application particulierement 
utile : un serveur d'anagrammes. . . 

Le serveur est une variation sur exemple_serveur_tcp.c, dans lequel nous modifions la 
routine de traitement des connexions ainsi : 

void 

traite_connexion (int sock) 
{ 

char buffer[256]; 
int longueur; 

while (1) { 

longueur = read(sock. buffer, 256); 
if (longueur < 0) { 

perror( "read" ) ; 

exit(EXIT_ FAILURE); 

} 

if (longueur == 0) 
break; 

buffer[l ongueur] = '\0'; 
strf ry(buffer) ; 

writetsock, buffer, longueur); 

} 

cl ose(sock) ; 

} 

De son cote, le client est construit a partir de stdin_2_tcp.c, en modifiant la routine princi- 
pale : 

int 

main (int argc, char * argv []) 

{ 

int sock; 



862 



Programmation systeme en C sous Linux 



struct sockaddr_in adresse; 



char 
int 



buffer [LG_BUFFER] ; 
nb_l us ; 



if (lecture_arguments(argc, argv, & adresse, "tcp") < 0) 

exit(EXIT_FAILURE); 
adresse. sin_family = AF_I NET ; 

if ((sock = socket(AF_INET, S0CK_STREAM, 0)) < 0) { 
perror( "socket" ) ; 
exit(EXIT_FAILURE); 



if (connect(sock, & adresse, sizeof (struct sockaddr_in) ) < 0) { 
perror( "connect" ) ; 
exit(EXIT_FAILURE); 



while (1) { 

if (fgets(buffer, 256, stdin) == NULL) 
break; 

if (buffer[strlen(buffer) - 1] == '\n') 
buffer[strlen(buffer) - 1] = '\0'; 

if (write(sock, buffer, strl en(buffer) ) < 0) { 
perror( "write" ) ; 
break; 

} 

if ((nbjus = read(sock, buffer, LG_BUFFER) ) == 0) 

break; 
if (nbjus < 0) { 

perror( "read" ) ; 

break; 

} 

fprintf (stdout, "£s\n", buffer); 



$ . /exemple_client_anagramme -a 192.1.1.51 -p 1693 
anagramme 

managrmea 
1 inux 
1 ixnu 
fin 
inf 



return EXIT_SUCCESS; 



L' execution se deroule comme prevu : 



$ ./exemple. 

Mon adresse 



serveur_anagramme 

» IP = 0.0.0.0, Port = 1693 



(Controle-C) 



$ 



(Controle 



C) 



$ 
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Acces aux options des sockets 

II existe de multiples options configurables concernant les sockets. La plupart ne sont utiles 
qu'a des fins de debogage des protocoles reseau ou pour des applications tres specifiques. 
Pourtant, certaines d'entre elles sont couramment employees. II existe deux appels-systeme, 
getsockopt( ) et setsockopt( ) , permettant de lire l'etat d'une option de configuration ou de la 
modifier. 

int getsockopt (int sock, int niveau, int option, 

void * valeur, socklen_t * longueur); 
int setsockopt (int sock, int niveau, int option, 

const void * valeur, socklen_t longueur); 

Le premier argument de ces routines est 1'identificateur de la socket concernee. Le second 
correspond au niveau auquel s' applique 1' option. Ce niveau represente en fait la couche de 
protocole correspondant a l'option desiree. Pour nous, il s'agira uniquement des valeurs SOL- 
SOCKET indiquant qu'il s'agit de la socket elle-meme, IPPR0T0_IP correspondant a la couche 
reseau IP, ou I PPR0T0_TCP pour la couche de transport TCP. Pour chaque option presentee 
ci-dessous, nous preciserons le niveau d' application. 

Le troisieme argument represente l'option elle-meme. En quatrieme argument on trouve un 
pointeur sur une variable contenant la valeur associee a l'option. Avec getsockopt( ), cette 
variable sera remplie, avec setsockopt ( ) elle sera lue. Enfin, on trouve en dernier argument la 
longueur de la variable employee pour stocker la valeur. Cette longueur doit dans tous les cas 
etre initialisee avant l'appel, meme si elle peut etre modifiee par getsockopt( ). Toutes les 
options presentees ci-dessous utilisent une valeur de type i nt, consideree comme vraie si elle 
est non nulle, a l'exception de S0_LI NGER qui emploie une structure 1 inger. 

Les options les plus courantes pour le niveau S0L_S0CKET sont les suivantes : 





Option 


Signification 


so_ 


.BROADCAST 


Autorisation de diffusion de messages broadcast sur une socket UDP. Nous decrirons ce 
mecanisme plus bas. 


so_ 


.BSDCOMPAT 


Lorsqu'une socket UDP est connectee, une tentative d'ecriture vers un port ou personne 
n'ecoute renverra une erreur ICMP. Ceci est egalement vrai sous Linux avec une socket UDP 
non connectee. Cette option - specifique a Linux - force le noyau a adopter un comportement 
BSD, en n'envoyant pas cette erreur sur les socket non connectees. 


so_ 


.DEBUG 


Activation des procedures de debogage dans les couches reseau du noyau. 


so_ 


.DONTROUTE 


Contournement des procedures de routage, les messages etant directement diriges vers 
I'interface correspondant a la partie sous-reseau de I'adresse du destinataire. 


so_ 


.ERROR 


Uniquement avec getsockopt( ) : renvoie la valeur d'erreur correspondant a la socket (les 
erreurs sont identiques a celles de errno). 


so_ 


.KEEPALIVE 


Activation d'un envoi periodique de messages sur une socket TCP connectee pour tester sa 
validite. Si le correspondant ne les acquitte pas, la communication est rompue. Ceci n'est 
generalement pas interessant car le delai entre deux messages est de I'ordre de plusieurs 
heures. 


so_ 




.LINGER 


Activation d'un delai de latence lors d'un appel cl ose( ) s'il reste des donnees non emises. 
Rarement utile. 
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Option 


Signification 


so. 


.OOBINLINE 


Autorisation pour que les donnees hors bande arrivant sur une socket soient placees dans le 
flux normal de lecture, sans necessiter d'option particuliere de recvt). Ceci permet de 
transmettre des messages avec des priorites superieures a d'autres. 


so. 
so. 


.RCVBUF et 
.SNDBUF 


Indique la taille du buffer de reception ou d'emission. 


so. 
so. 


.RCVLOWAT et 
.SNDLOWAT 


Ces valeurs correspondent a des seuils inferieurs dans les buffers de reception et d'emission, 
qui declenchent - lorsqu'ils sont depasses - une reponse positive de sel ect ( ) pour la socket. 


so. 
so. 


.RCVTIMEO et 
.SNDTIMEO 


Uniquement avec getsockopt( ), ces valeurs represented un delai maximal en reception et 
en emission. 


so. 


.REUSEADDR 


Autorisation de reutiliser une adresse deja affectee. Cette option est presentee ci-dessous. 


so. 


.TYPE 


Uniquement avec getsockoptt ), renvoie la valeur correspondant au type de socket 
SOCK_STREAM, SOCK_DGRAM, S0CK_RAW... 



Les options qui interessent en general le programmeur applicatifs sont done essentiellement 
S0_BR0ADCAST et SO_REUSEADDR, et parfois S0_BSDC0MPAT. 

L' option SCLREUSEADDR permet notamment de relancer immediatement un serveur TCP qu'on 
vient d'arreter sans obtenir l'erreur EADDRINUSE lors du bindO. On insere l'appel setsock- 
opt( ) avant le bi nd( ): 

int autorisation; 
autorisation = 1; 

setsockopt(sock, S0L_SOCKET, SO_REUSEADDR, 

& autorisation, sizeof (int) ) ; 



Notez bien que cette option est tres utile, et que Ton peut considerer que tous les serveurs TCP/IP devraient 
I'activer. 



L' option SCLBROADCAST permet d'effectuer de la diffusion globale, ce qui consiste a envoyer un 
message UDP en direction de tout un sous-reseau. L' ensemble des stations ayant une adresse 
IP dans ce sous-reseau recevra le paquet de donnees et le fera remonter jusqu'a la couche 
UDP. Si une application est en ecoute sur le bon numero de port, elle recevra les informations. 
Ce mecanisme permet d'arroser tout un ensemble de machines avec des donnees. 

L' adresse de diffusion correspondant a un sous-reseau est obtenue en remplissant tout l'espace 
reserve pour les adresses des stations par des 1 binaires. Ainsi, sur un sous-reseau de classe C 
192 .1.1., la diffusion broadcast s'obtient en envoyant des donnees a Fadresse 192.1.1. 255. 
Pour etre sur de ne pas effectuer cette operation de maniere fortuite, il faut l'indiquer explici- 
tement dans la configuration de la socket : 

int autorisation; 

sock = socket(AF_INET, SOCK_DGRAM, 0); 
autorisation = 1; 

setsockopt(sock, S0L_SOCKET, S0_BR0ADCAST, 

& autorisation, sizeof (autorisation) ; 
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Ensuite, on peut envoyer des messages a Fadresse de diffusion. La reception se fait de 
maniere transparente, il suffit de lire les donnees sur le port adequat. 

La diffusion broadcast est un mecanisme tres utile dans certaines situations, quand toutes les 
machines du meme sous-reseau assurent une tache similaire (affichage ou calculs en paral- 
lele) avec des donnees identiques. Cependant, meme les stations non interessees par les donnees 
sont obligees de les faire remonter jusqu'a la couche UDP, oil elles seront rejetees a cause de 
leur numero de port. Ceci implique une surcharge de travail parfois importante. 

Afin d'affiner le filtrage, il existe un autre mecanisme de diffusion, employant des adresses 
multicast qui sont traitees directement au niveau de F interface reseau et de la couche IP. 

Le principe de diffusion multicast consiste a obliger une application desireuse de recevoir les 
donnees a s'inscrire explicitement dans le groupe de diffusion. Cette inscription se fait au 
niveau de la couche reseau. Ainsi une machine dans laquelle aucun processus n'est interesse 
par ces informations n'a pas besoin de les laisser remonter dans ses couches IP et UDP. 

Les adresses de groupes multicast se trouvent dans Fintervalle IP 224.0.0.0 a 239.255.255.255. 
Pour envoyer des donnees a tout un groupe de diffusion, il suffit done d'ecrire dans une socket 
UDP dirigee sur Fune de ces adresses. 

Pour gerer son inscription et recevoir ainsi les informations, un processus doit renseigner une 
structure ip_mreq, definie ainsi : 



Norn Type Signification 

imrjnul ti addr struct in_addr Adresse du groupe de diffusion qu'on desire rejoindre. 

imr_interface struct in_addr Interface reseau a employer pour joindre le groupe. En general, on utilise 

INADDR_ANY. 



Pour joindre un groupe, il faut utiliser l'option IP_ADD_MEMBERSHIP du niveau IPPR0T0_IP de la 
socket (ce niveau d'options est presente dans un tableau plus bas). Cette option prend en argu- 
ment une structure ipjnreq. A partir de ce moment, les donnees a destination de l'adresse 
indiquee dans ip_mreq.imr_multiaddr remonteront jusqu'a la couche UDP de la machine 
receptrice. Ensuite, elles seront disponibles sur le numero de port qui leur est attribue. Le 
processus recepteur doit done invoquer egalement bi nd ( ), pour preciser le port sur lequel il 
ecoute. 



Sous Linux, on peut invoquer bindO avant ou apres I'inscription dans le groupe multicast ; cela n'a pas 
d'importance. Sous d'autres Unix et sous Windows, il faut que le bind( ) soit appele en premier. 



Le programme udp_2_stdout . c peut etre modifie pour recevoir des donnees multicast. 
exemple_reception_multicast.c : 

int 

main (int argc, char * argv[]) 

{ 

int sock; 

struct ip_mreq requetejnulticast; 

struct sockaddr_in adresse; 

char buffer[LG_BUFFER] ; 
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int nb_lus; 

if (lecture_arguments(argc, argv, & adresse, "udp") < 0) 

exit(EXIT_FAILURE); 
adresse. sin_family = AF_I NET ; 

if ((sock = socket(AF_INET, S0CK_DGRAM, 0)) < 0) { 
perror( "socket" ) ; 
exit(EXIT_FAILURE); 

} 

requete_mul ti cast . imrjnul ti addr . s_addr = 

adresse. sin_addr.s_addr; 
requete_multicast.imr_interface.s_addr = htons(INADDR_ANY) ; 

adresse. sin_addr.s_addr = htons(INADDR_ANY); 

if (bindtsock, & adresse, sizeof (struct sockaddr_in) ) < 0) { 

perror("bind"); 

exit(EXIT_FAILURE); 

} 

if (setsockopt(sock, IPPR0TO_IP, IP_ADD_MEMBERSHIP , 

& requetejnulticast, sizeof (struct ip_mreq)) < 0) { 
perror( "setsockopt" ) ; 
exit(EXIT_FAILURE); 

} 

setvbuf(stdout, NULL, _I0NBF, 0); 
while (1) { 

if ((nbjus = recv(sock, buffer, LG_BUFFER, 0)) == 0) 

break; 
if (nbjus < 0) { 

perror( "read" ) ; 

break; 

} 

write(STD0UT_FILEN0. buffer, nbjus); 

} 

return EXIT_SUCCESS; 

} 

Pour que la reception fonctionne, il faut que le systeme sache que les paquets diriges vers 
1' adresse multicast du groupe choisi doivent etre transferes a la couche IP, sinon ils seront 
rejetes des la couche reseau. II faut done utiliser /sbin/route. Supposons que nous voulions 
utiliser le groupe multicast 224.0.0.0. Nous allons configurer la reception, puis passer en 
ecoute, une autre machine enverra des donnees multicast. 

$ su 

Password: 

# /sbin/route add 224.0.0.0 dev ethO 

# exit 

exit 

$ . /exemple_reception_multicast -a 224.0.0.0 -p 1234 
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$ ./stdin_2_udp -a 224.0.0.0 -p 1234 
Chaine emise en multicast 

Chaine emise en multicast 

(Controle-C) 

$ 

(Controle-C) 

$ 



Les options du niveau IPPR0TO_IP qui nous concement sont celles qui ont trait a la diffusion 
multicast, les autres etant a un niveau trop bas dans le protocole : 


Options 


Signification 


I P_ADD_MEMBERSH I P et 
IP_DROP_MEMBERSHIP 


Demande I'inscription ou le desistement d'une socket UDP dans un groupe multicast. 
La valeur est representee sous forme d'une structure i p_mreq decrite plus haut. 


IP_MULTICAST_IF 


Permet de preciser I'interface reseau a utiliser pour recevoir les donnees. La valeur est 
une structure in_addr. 


IP_MULTICAST_L00P 


Activation ou non d'un echo via I'interface loopback des messages multicast emis si 
I'emetteur est membre du groupe de reception. 


IP_MULTICAST_TTL 


Configuration du champ Time-To-Live du paquet IP diffuse en multicast. II s'agit d'une 
valeur entiere indiquant approximativement le nombre de routeurs que le paquet peut 
franchir avant d'etre detruit. Normalement, cette valeur vaut 1 pour limiter la portee des 
messages au meme reseau physique. 


Les options du niveau 


IPPROTCMTP sont essentiellement les suivantes : 


Option 


Signification 


TCP_MAXSEG 


Configuration de la taille maximale des segments de donnees transmis par le protocole. 
Doit etre inferieur a la valeur de MTU de I'interface reseau (en general 1500 pour les 
cartes Ethernet et les liaisons PPP). 



TCP_N0DELAY Cette option empeche TCP de mettre en attente - quelques centiemes de secondes - 



les petits paquets de donnees pour essayer de les regrouper en un seul gros paquet, 
afin de limiter la surcharge due aux en-tetes TCP. Ceci n'est utile que si de toutes petites 
quantites de donnees doivent etre traitees tres rapidement (des mouvements de souris 
par exemple). 



Seule Foption TCP_N0DELAY peut parfois avoir une utilite dans les applications courantes. 

Programmation d'un demon ou utilisation de inetd 

Lorsqu'un serveur de donnees TCP a atteint un niveau de maturite fonctionnelle suffisant 
pour presenter un interet global au niveau du systeme et du reseau (par exemple un serveur 
d'anagrammes), il est souvent interessant de le faire fonctionner en tant que demon. 

Un demon est un processus tournant en arriere-plan sur le systeme, sans terminal de controle. 
En general, les demons sont demarres lors de F initialisation du systeme, et on les laisse 
s'executer jusqu'a l'arret de la machine. Pour transformer un serveur classique en demon, il 
faut respecter certaines regies : 
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1. Tout d'abord le demon doit passer en arriere-plan. Pour cela on utilise : 

if (forkO != 0) 

exit ( EXIT_SUCCESS) ; 

2. Le demon ne doit bloquer aucune partition du systeme - sauf s'il s'agit de ses propres 
repertoires comme /var/spool /l pd pour le demon 1 pd. Aussi il faudra en general remonter 
a la racine du systeme de fichiers : 

chdirCV"); 

3. Le processus doit creer une nouvelle session et s'assurer qu'il n'a pas de terminal de 
controle. Nous avons deja observe ceci dans le chapitre 2 : 

setsid( ) ; 

if (forkO != 0) 

exit(EXIT_SUCCESS); 

4. Finalement, le demon doit fermer tous les descripteurs de fichiers que le shell aurait pu lui 
transmettre. Une methode courante est d'utiliser : 

for (i =0; i < 0PEN_MAX; i ++) 
cl ose( i ) ; 

Nature llement, le demon ne pourra plus afficher de message sur stderr, il lui faudra employer 
le mecanisme sysl og( ) que nous avons etudie dans le chapitre 26. 

Le programme exemple_demon_anagraimrie.c est une replique de exemple_serveur_anagramme.c 
dans lequel nous avons remplace toutes les occurrences de 

perror( "xxx" ) ; 

par 

syslog(L0G_ERR, "xxx : %m"); 

et 

fprintf(stdout. "IP = %s, port = %\i \n", ...); 
par 

syslog(L0G_INF0, "IP = %s, port = %u", ...); 
La fonction principale est devenue : 
int 

main (int argc, char * argv[]) 
{ 

int i ; 

chdirCV"); 

if (forkO != 0) 

exit(EXIT_SUCCESS); 
setsid( ) ; 
if (forkO != 0) 

exit(EXIT_SUCCESS); 
for (i =0; i < 0PEN_MAX; i ++) 

closed' ) ; 
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serveur_tcp( ) ; 
return EXIT_SUCCESS; 

I > 

Le programme se comporte tout a fait comme un demon classique : 

$ . /exempl e_demon_anagramme 
$ ps aiix | grep "[d]emon" 

ccb 1979 0.0 0.4 1232 516 ? S 22:53 0:00 . /exempl e_demon_a 
$ tail /var/log/messages 
[...] 

Mar 17 22:53:52 venux exempl e_demon_anagramme: IP = 0.0.0.0, Port = 1059 
$ . /exempl e_cl ient_anagramme -p 1059 
linux 
uxl ni 

(Controle-C) 
$ kill all exempl e_demon_anagramme 
$ ps aiix | grep "[d]emon" 
$ 

En fait, ce programme gagnerait a employer un numero de port fige, inscrit dans /etc/ servi ces, 
plutot que de nous obliger a regarder le fichier de messages de sysl og( ) pour le trouver. 

Une alternative a la programmation d'un demon est Femploi du superserveur reseau inetd. 
Ce demon lit au demarrage sa configuration dans /etc/i netd . conf et assure toute la gestion 
de l'aspect serveur TCP. Lorsqu'une connexion a ete etablie, il invoque directement l'utili- 
taire demande, en ayant redirige - grace a dup( ) - son entree et sa sortie standard vers la 
socket obtenue. 

Sur la plupart des distributions Linux - mais pas toutes - i netd a ete remplace par xi netd, son 
successeur apportant de nombreuses options supplementaires, notamment en ce qui concerne 
la securite du systeme. 

Notre serveur d'anagrammes peut alors etre reecrit tout simplement ainsi : 
exemple inet.anagramme.c : 

#define _GNU_S0URCE 
#include <ctype.h> 
#include <stdio.h> 
#include <string.h> 
#include <unistd.h> 

int 
main (void) 

{ 

char chaine[256]; 
int n; 

while (1) { 

if Un = read(STDIN_FILEN0, chaine, 256)) <= 1) 
break; 

while (isspace(chaine[n - 1])) 

n -- ; 
chaine[n] = '\0' ; 
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strf ry(chaine) ; 

write (STD0UT_FILEN0, chaine, n); 

} 

return EXIT_SUCCESS; 

} 

II nous faut alors ajouter un port dedie dans /etc/services et une ligne de lancement dans 
/etc/inetd.conf. On se reportera aux pages de manuel inetd(8) et inetd.conf (8) pour plus 
de details sur la syntaxe. 

$ su 

Password: 

# cp exemple_inet_anagramme /usr/local/bin/ 
§ vi /etc/services 

(edition et ajout de la ligne) 
anagramme 2000/tcp 

# vi /etc/inetd.conf 

(edition et ajout de la ligne) 
anagramme stream tcp nowait root /usr/local/bin/exemple_inet_anagramme 
§ kill all -HUP inetd 

# exit 
$ 

On peut a present tester le serveur aussi bien avec le logiciel client dedie qu'avec tel net. 

$ ./exemple_client_anagramme -p 2000 

1 inux 
Ixniu 
cl ient 
neilct 

$ telnet localhost 2000 

Trying 127.0.0.1. . . 

Connected to localhost. 

Escape character is '*]'. 

unix 

ni ux 

serveur 

sueerrv 

Connection closed by foreign host. 
$ 



Conclusion 

Nous avons etudie dans ce chapitre les rudiments de la programmation reseau en TCP/IP et 
UDP/IP, en soulignant bien la puissance du concept de socket, puisque ce mecanisme simple 
et qui herite logiquement des methodes classiques de communication entre processus permet 
de donner une dimension nouvelle aux applications en leur offrant de dialoguer avec des 
stations reparties dans le monde entier. 

Nous avons limite notre presentation aux informations les plus utiles pour un programmeur 
applicatif. Bien entendu, il existe encore de nombreux points qui n'ont pas ete abordes. La 
reference essentielle dans ce domaine est [STEVENS 1990] UNIX Network Programming. 
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On pourra trouver de precieux renseignements dans la Faq Unix Socket Faq for Network 
Programming, postee dans le groupe Usenet comp.unix. programmer. 

On se reportera egalement aux documents Linux NET-3-HOWTO et Multicast-HOWTO. 

Les RFC restent la source ultime - mais peu digeste - de reference en ce qui concerne le 
reseau. Nous en avons indique quelques-unes dans le chapitre precedent. 
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La gestion des terminaux, sous Linux du moins, est souvent et principalement motivee par 
Fun des trois principes suivants : 

• Les entrees-sorties habituelles ne permettent pas de capturer des caracteres au vol sans que 
l'utilisateur n'appuie sur la touche Entree. Dans certaines applications, on peut avoir 
besoin de modifier le mode du terminal pour adopter ce type de comportement. 

• Lorsqu'on veut proposer une connexion a distance, a la maniere des demons telnetd ou 
rlogind, il est souvent necessaire d'utiliser des fonctionnalites particulieres offertes par le 
noyau, par le biais des pseudo-terminaux. 

• Sur un PC sous Linux, les lignes d' entree-sortie serie ne sont generalement pas utilisees 
pour connecter de veritables terminaux mais plutot pour brancher des equipements divers 
- modems, imprimantes, materiel personnel -, et F initialisation de ces ports RS-232 
emploie les methodes de configuration des terminaux. 

Nous allons done etudier les fonctions de manipulation des terminaux avec ces trois optiques 
successives. 

Definition des terminaux 

La notion de terminal Unix a ete introduite dans les systemes oil une unite centrale accueillait 
les connexions en provenance d'une ou plusieurs dizaines de terminaux travaillant en mode 
texte. Depuis quelques annees ces ensembles ont pratiquement disparu, remplaces par des 
stations de travail integrant F unite de calcul et un terminal graphique haute resolution, 
connectes par reseau Ethernet afin de partager grace au protocole NFS les ressources disque. 

Cette evolution est encore plus marquee avec les PC sous Linux, sur lesquels il est bien rare 
qu'une machine dispose de plus d'un ou deux ports RS-232, et encore plus rare que ceux-ci 
servent a connecter des terminaux en mode texte, sauf a titre de curiosite purement experimen- 
tale. Toutefois les mecanismes de configuration sont toujours disponibles et servent a gerer les 
consoles virtuelles, les pseudo-terminaux ou des liaisons RS-232 avec divers equipements. 
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Chaque terminal qu'on pouvait connecter sur une unite centrale offrait des possibilites speci- 
fiques, et sa configuration differait toujours quelque peu des autres modeles. Ces parametres 
concernent par exemple les codes servant a effacer Fecran, a deplacer le curseur ou a changer 
la couleur du texte. Une liste imposante de terminaux differents avec leurs caracteristiques est 
done disponible dans le fichier /etc/termcap des systemes Unix. 

Le noyau gere le terminal de maniere a offrir une interface homogene aux processus lorsqu'ils 
y accederont avec les appels-systeme read( ) et write ( ). Pour configurer Fetat d'un terminal, 
le noyau propose une serie de parametres regroupes dans une structure termios, qu'on 
nomme discipline de ligne. Nous reviendrons sur son contenu plus bas. 

La discipline de ligne s'intercale done entre le terminal et le processus. Le noyau incorpore 
aussi deux buffers pour conserver les touches appuyees afin qu'elles soient lues par le pro- 
gramme et pour enregistrer les caracteres envoyes, jusqu'a ce que le terminal soit pret a les 
afficher. 



Noyau 



Terminal 



Lecture 



Processus 
utilisateur 



Buffer entree 



Ecriture 



Buffer sortie 



Discipline de ligne 



struct termios 



Figure 33.1 

Organisation de la configuration du terminal 



Les methodes de configuration des terminaux etaient a l'origine fondees sur l'appel-systeme 
ioctlO, qui offre une interface de bas niveau avec les peripheriques d' entree-sortie. Ce 
mecanisme est complexe et peu portable. D' autres fonctions ont done ete definies par Posix, 
bien qu'il reste encore quelques extensions BSD ou Systeme V disponibles sous Linux. 

Un terminal peut etre utilise dans deux modes nommes traditionnellement canonique et non 
canonique : 

• En mode canonique, les saisies sont transmises au processus ligne par ligne. Ceci signifie 
que tant que l'utilisateur n'a pas appuye sur la touche Entree, le pilote de terminal n'envoie 
rien au processus qui effectue un read( ). Cette configuration est celle etablie par defaut sur 
les terminaux sous Unix, nous en avons deja parle a de multiples reprises dans ce livre. 

• En mode non canonique ou brut (raw), le terminal transmet immediatement les caracteres 
sur lesquels on appuie. Un read( ) ne nous retournera done pas necessairement des lignes 
entieres. 

Chacun de ces modes presente des avantages : 

Le mode canonique permet de laisser le pilote de terminal gerer entierement les corrections, 
effacement, etc. Lors d'une saisie avec fgetsO, l'utilisateur pourra revenir en arriere avec 
la touche d'effacement et corriger sa ligne. Seule la pression sur la touche Entree validera 
vraiment la saisie. 
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Le mode non canonique permet de construire des applications d'edition de texte plus dynami- 
ques, puisqu'on pourra gerer un curseur avec les touches flechees, les sauts de page, etc. Le 
processus peut aussi capturer des caracteres au vol dans des applications ou les saisies de 
Futilisateur se deroulent en parallele avec d'autres taches. 

Une ligne, en mode canonique, est soumise a une longueur maximale de MAX_CAN0N carac- 
teres, definie dans <1 imi ts . h>. Cette valeur, 255 sous Linux, est souvent utilisee pour dimen- 
sionner des chaines de caracteres avant d'appeler fgets( ). 

Configuration d'un terminal 

La structure termios comporte cinq membres definis par SUSv3 : 





Nom 


Type 


Signification 


c 


j'flag 


tcfl ag_t 


Attributs definissant le mode d'entree depuis le terminal 


c 


_of 1 ag 


tcfl ag_t 


Attributs concernant le mode de sortie vers le terminal 


c 


_cflag 


tcfl ag_t 


Attributs permettant le controle du terminal 


c 


J flag 


tcfl ag_t 


Attributs locaux pour le terminal 


c 


_cc 


cc_t[] 


Variables concernant le terminal. Essentiellement des affectations de touches 



Nous allons examiner en detail les attributs un peu plus loin. Indiquons tout de suite que 
la repartition des attributs dans les differents membres n'a rien d'intuitif et que certaines 
fonctionnalites, comme la gestion des signaux, necessitent d'agir sur plusieurs attributs, en 
Foccurrence c_i f 1 ag et c_cf 1 ag. 

La configuration du terminal s'effectue a l'aide des fonctions tcgetattrO et tcsetattrO, 
qui permettent de lire ou de fixer la valeur de la structure termi os. 

int tcgetattr (int terminal, struct termios * configuration); 

int tcsetattr (int terminal, int option, struct termios * configuration); 



Attention 

Les structures termios comportant des champs avec un grand nombre d'attributs, il est important de lire 
I'etat du terminal avec tcgetattrO avant de modifier les membres voulus, puis de la reecrire avec 
tcsetattr( ). 



Le premier argument de ces fonctions doit etre un descripteur de terminal, par exemple 
STDIN_FI LENO. La routine tcsetattrC ) utilise une option qui precise a quel moment les modi- 
fications eventuelles doivent avoir lieu. II peut s'agir de l'une des constantes suivantes : 



Nom 


Signification 


TCSANOW 


Les modifications sont appliquees immediatement. 


TCSADRAIN 


Les modifications prendront effet lorsque tous les caracteres en attente d'affichage auront ete lus par 
le terminal. 


TCSAFLUSH 


Comme avec TCSADRAIN, on attend que le contenu du buffer de sortie ait ete transmis, mais de plus 
le buffer d'entree sera automatiquement purge. 
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Tant qu'aucune information n'a ete transmise, juste apres l'ouverture du terminal, on pourra 
done employer TCSANOW pour le configurer, mais ensuite on utilisera TCSAFLUSH ou TCSADRAIN 
en fonction de 1' importance qu'on accorde aux donnees en attente de lecture. 

Le retour de tcsetattr( ) est problematique, car cette fonction n'echoue que si aucune modi- 
fication n'a pu etre apportee a la structure termios originale. Pour verifier que tout s'est bien 
passe, il est done necessaire de relire a nouveau la configuration avec tcgetattrO et de 
comparer le resultat avec les options demandees. L' attitude defensive, voire paranoiaque, a 
adopter est la suivante : 

1. Lecture de la structure termios avec tcgetattr( ). 

2. Modification des membres de la structure. 

3. Ecriture des nouveaux attributs avec tcsetattr( ). 

4. Lecture de la configuration reellement acceptee avec tcgetattrO. 

5. Comparaison entre les modifications demandees et celles qui ont ete obtenues. 

Lutilisation de TCSAFLUSH permet d'implementer la fonctionnalite que de trop nombreux 
debutants esperent obtenir en invoquant ffl ush(stdin) , qui n'a aucune signification. II suffit 
de recopier la configuration du terminal sans la modifier. En voici un exemple : 

exemple_flush.c : 

#include <stdio.h> 
#include <termios.h> 
#include <unistd.h> 

int 
main (void) 
{ 

struct termios terminal; 
int i ; 

fprintf (stdout, "FLUSH dans 5 secondes \n"); 
si eep(5) ; 

fprintf(stdout, "FLUSH !\n"); 

if (tcgetattr(STDIN_FILENO, & terminal) == 0) 

tcsetattr(STDIN_FILENO, TCSAFLUSH, & terminal); 
while ((i = fgetc(stdin)) != EOF) 

fprintf (stdout, "%02X ", i); 
return EXIT_SUCCESS; 

} 

Les caracteres saisis pendant les cinq secondes d' attente du programme sont purges lors du 
tcsetattr( ) suivant : 

$ ./exemple_flush 

FLUSH dans 5 secondes 
Ceci sera oublie 

FLUSH ! 

(Controle-D) 

$ 
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II existe une fonction tcf 1 ush( ) qui assure le meme role, en permettant de vider au choix le 
buffer d' entree ou celui de sortie : 

int tcflush (int terminal, int buffer); 

Le second argument peut prendre l'une des valeurs suivantes : 



Nom 


Signification 




TCIFLUSH 


Purge du buffer d'entree, comme nous I'avons fait avec tcsetattr( ). 




TCOFLUSH 


Purge du buffer de sortie. 




TCIOFLUSH 


Purge des deux buffers. 





Si on desire s' assurer que toutes les donnees ecrites ont bien ete traitees par le terminal, on 
peut utiliser la fonction tcdrain( ). Celle-ci est bloquante tant que le buffer de sortie n'est pas 
vide. 

int tcdrain (int descripteur) ; 



Attention 

Si on se sert des fonctions de la bibliotheque stdio, il faut penser a employer ffl ush(stdout) avant 
d'utiliser tcdrainO, sinon des donnees pourraient encore se trouver dans la memoire tampon interne a la 
bibliotheque. 



On peut aussi vouloir bloquer temporairement l'entree ou la sortie sur un terminal. Ceci est 
surtout utilise dans des applications de communication, afin d' assurer un controle de flux 
entre les deux extremites. La fonction tcflowO permet de gerer ainsi les deux canaux inde- 
pendamment : 

int tcflow (int terminal, int blocage); 

Le second argument peut prendre l'une des valeurs suivantes : 



Nom 


Signification 


TCIOFF 


On envoie au terminal un caractere STOP (voir plus loin). II vadonc arreter d'emettre des donnees afin 
que nous puissions traiter le contenu du buffer d'entree. 


TCION 


On envoie un caraotere START au terminal. II peut reprendre I'envoi de donnees. 


TCOOFF 


On interdit temporairement remission de donnees (suite a la reception d'une requete du terminal). 
Les tentatives d'ecriture seront bloquantes. 


TCOON 


On debloque remission de donnees. Les ecritures pourront reprendre. 



La routine tcflowO peut etre employee dans un gestionnaire de signaux. Ceci permet 
d'implementer un controle de flux. Le gestionnaire peut etre invoque en reception de donnees, 
par exemple avec l'une des methodes de traitement asynchrone etudiees dans le chapitre 30. 
Lors de Parrivee de certaines conditions (caracteres speciaux), le gestionnaire peut ainsi 
bloquer le buffer de sortie. Si des tentatives d'ecriture ont lieu dans le corps du programme, il 
restera bloque, sinon il se deroulera normalement. Lorsque la condition de deblocage se 
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presentera, le gestionnaire pourra liberer le buffer de sortie et relancer ainsi 1' execution 
normale du processus. 

Notons l'existence d'une derniere fonction de cette famille, tcsendbreak( ), qui permet 
d'envoyer un caractere Break sur la ligne serie du terminal : 

int tcsendbreak (int terminal, int duree); 

Un signal Break n'est pas vraiment un caractere mais plutot une succession de bits a zero 
pendant une duree superieure au temps d'emission d'un caractere. Ce signal est done reconnu 
par le peripherique connecte sur la liaison serie comme une pseudo-erreur reclamant son 
attention. L' utilisation depend ensuite du protocole de haut niveau choisi ; on peut F employer 
pour synchroniser le dialogue par exemple. Le second argument represente la duree, mais 
l'unite n'est pas definie par SUSv3. Aussi est-il conseille d' employer une valeur nulle, ce qui 
correspond, de maniere portable, a un caractere Break qui dure entre un quart et une demi- 
seconde. 

Nous allons a present examiner les valeurs possibles pour les membres de la structure 
termios. Certaines constantes sont definies par SUSv3, d'autres sont des extensions BSD ou 
Systeme V. La liste des attributs est un peu fastidieuse, mais il est utile de bien voir les diffe- 
rents elements entrant en jeu, principalement en ce qui concerne la table c_cc[], 

Membre c_iflag de la structure termios 

Ce champ est compose d'un OU binaire entre differents arguments, permettant de definir la 
discipline de ligne pour les caracteres provenant du terminal. Sauf indication contraire, ces 
arguments sont de finis par EXIT_SUCCESS. 



Norn 


Signification 


BRKINT 
IGNBRK 


Lorsqu'un caractere Break arrive, il est ignore si IGNBRK est present. Sinon, si BRKINT est actif, il 
declenchera le signal SIGINT sur le processus en avant-plan. Si aucun de ces attributs n'est present, le 
caractere Break sera lu comme un zero « \0 » presentant une erreur de cadrage (voir PARMRK ci- 
dessous). 


ICRNL 
IGNCR 


Si IGNCR est active, les caracteres de retour chariot sont ignores en entree. Si ICRNL est present, ils 
sont transformes en saut de ligne. Sinon, ils sont lus comme des caracteres « \r ». 


IGNPAR 
PARMRK 


Si IGNPAR est actif, un caractere presentant une erreur de cadrage (trap long ou trop court) ou de parite 
est ignore. Si PARMRK est present, le caractere est prefixe du code d'erreur OxFF, 0x00 (un caractere 
OxFF valide est alors indique sous forme OxFF OxFF). Sinon, le caractere est simplement lu comme un 
zero « \0 ». 


IMAXBEL 


Extension BSD et Systeme V non definis par SUSv3. Avec cet attribut, le systeme declenchera un bip 
sur le terminal lorsque le buffer d'entree sera plein. La taille du buffer d'entree est de MAX_INPUT 
caracteres. Cette valeur (255 sous Linux) est definie dans <lim1ts.h>. 


INLCR 


Avec cet attribut, un caractere « nouvelle ligne » regu en entree sera converti en retour chariot. Sinon, il 
est lu comme le caractere « \n » habituel. 


INPCK 


Cet attribut active la verification de la parite des caracteres regus. 


ISTRIP 


Si ISTRIP est actif, les caracteres regus en entree seront tronques pour tenir sur 7 bits. Le huitieme bit 
est purement et simplement supprime. 


IUCLC 

1 


Extension Systeme V non definis par SUSv3. Un caractere majuscule regu en entree est transforme en 
minuscule. Les caracteres sur 8 bits sont ramenes sur 7 bits comme avec ISTRIP. 
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Norn Signification 

IXON Lorsque cet attribut est actif, le terminal assure le controle de flux. Les caracteres STOP et START definis 
dans la table c_cc[] que nous verrons plus bas servent a bloquer ou a debloquer I'envoi de donnees 
par le processus. Sinon, ces caracteres parviennent indemnes au programme. 

IXOFF Avec cet attribut, I'ordinateur gere le controle de flux en entree en envoyant les caracteres STOP et 
START au terminal, en fonction du remplissage du buffer d'entree. 

Membre c_oflag de la structure termios 

OPOST sert a autoriser Taction des autres attributs du champ c_of 1 ag. 



Noms 


Signification 


BSDLY 
BSO, BS1 


R c n 1 Y pnrrpQnnnrl a iin maQmip Hp hitQ rprm u/rant Ipq attrihiitQ Hp onnfini iratinn Hii HpIpi Hp rptniir 

D JUL 1 L.UI 1 co|JUI IU a UN IMcioLjUc Uc Ullo ICOUUVIallL Ico ctlUIUULo UC UUI II iy Ul allUI 1 UU Utfldl UC IUIUUI 

en arriere Backspace. Ce masque doit done etre efface du champ c_of 1 ag avant d'y inscrire I'une 
des deux valeurs possibles de delai BSO ou BS1. 


CRDLY 
CRO, CRl, 
CR2, CR3 


CRDLY est le masque de bits correspondant aux delais de retour chariot. Les quatre valeurs 
possibles vont de CRO a CR3. 


FFDLY 
FFO, FFl 


FFDLY est le masque de delai de saut de page, avec deux valeurs possibles, FFO et FFl. 


NLDLY 
NLO, NL1 


Ces attributs represented le masque et les deux valeurs pour le changement de ligne. 


OCRNL 
ONLCR 


Avec OCRNL, les caracteres de retour chariot « \r » seront remplaces par des caracteres « \n » de 
nouvelle ligne. Avec ONLCR, la conversion inverse a lieu. 


OFDEL 


Extension non decrite par SUSv3. Le caractere de remplissage, utilise pour temporiser les sorties, 
sera le caractere DEL 0x7 F si cet attribut est actif. Sinon, il s'agira du caractere nul. 


OFILL 


Cet attribut demande au pilote de peripherique d'utiliser le remplissage avec un caractere nul ou 
DEL pour gerer les delais de temporisation. Sinon, le pilote attendra simplement sans rien envoyer. 


OLCUC 


Extension non decrite par SUSv3. Les caracteres minuscules seront transformed en majuscules en 
sortie avec cet attribut. Les caracteres hors de la table Ascii sont tronques a 7 bits. 


ONLRET 


Avec I'attribut ONLRET, on suppose que le caractere « \n » effectue egalement le travail du retour 
chariot « \r » en sortie. 


ONOCR 


Si cet attribut est actif, aucun caractere « \r » ne sera envoye en premiere position d'une ligne. 


TABDLY 
TABO, TABl 
TAB2, TAB3 
XTABS 


Masque et valeurs pour le delai de tabulation horizontale. La valeur XTABS demande au pilote de 
peripherique de remplacer les tabulations par des espaces, en placant les taquets toutes les huit 
colonnes. 


VTDLY 
VTO, VTl 


Masque et valeurs de delai pour la tabulation verticale. 



Membre c_cflag de la structure termios 

Dans ce champ, on trouve des informations concernant la liaison serie entre F unite centrale et 
le terminal. Dans le cas oil le terminal n'est pas reellement connecte par une liaison serie 
(consoles virtuelles, pseudo-terminaux), ce champ est ignore. 
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II existe quelques extensions BSD sur d'autres systemes, mais les attributs utilises sous Linux 
sont tous definis par SUSv3, a l'exception du controle de flux CTS/RTS. 



Noms 


Signification 


CLOCAL 


Cet attribut sert a inhiber I'utilisation des lignes de controle du modem. 


CREAD 


Lorsque cet attribut est actif, la reception de donnees est possible. 


CRTSCTS 


Extension non definie par SUSv3. Le controle de flux avec les signaux RTS/CTS est active par cet 
attribut. 


CSIZE 
CS5, CS6, 
CS7, CS8 


CSIZE represents le masque binaire recouvrant les bits utilises pour definir la longueur des carac- 
teres transmis. On emploie les constantes CS5 a CS8 pour fixer la faille du caractere. Nous en verrons 
un exemple plus tard. 


CSTOPB 


Lorsque cet attribut est actif, les caracteres seront delimites par deux bits d'arret. Sinon, ils n'auront 
qu'un seul bit d'arret. 


HUPCL 


Si cet attribut est active lorsque le descripteur est referme par le dernier processus qui le tenait 
ouvert, les signaux de controle sont abaisses et le modem est alors raccroche. 



PARENB Lattribut PARENB active I'utilisation de la parite. Lorsque PARODD est present, il s'agit d'une parite 
PARODD impaire, sinon c'est une parite paire. 



Membre c_lflag de la structure termios 

Ce champ contient la configuration de la partie locale du pilote de peripherique, recouvrant 
surtout les notions d'echo des caracteres saisis et la gestion des signaux provenant du 
terminal. 



Norn 


Signification 


ECHO 


Cet attribut represente I'echo des caracteres saisis. 


ECHOCTL 


Extension BSD et Systeme V non definis par SUSv3: echo des caracteres de controle (inferieurs a 
0x1 F) sous forme de lettres prefixees du symbole A comme dans la table Ascii presentee en annexe. 


ECHOE 


En mode canonique, le caractere ERASE efface la lettre precedents, et WERASE efface le mot precedent. 


ECHOK 


En mode canonique, le caractere KILL efface toute la ligne. 


ECHONL 


En mode canonique, le caractere « \n » est renvoye en echo meme si I'attribut ECHO n'est pas active. 


FLUSHO 


Extension BSD et Systeme V, cet attribut est bascule a la reception du caractere DISCARD. II indique 
que le buffer de sortie doit etre purge. 


ICANON 


Attribut permettant de passer du mode brut au mode canonique. 


IEXTEN 


Activation du mode etendu dans le traitement des entrees depuis le terminal. Le comportement de 
certains caracteres de controle que nous examinerons ci-dessous depend de cet attribut. 


ISIG 


Activation des signaux dus aux caracteres INTR, QUIT, SUSP ou DSUSP. 


NOFLSH 


Cet attribut indique que les buffers d'entree el de sortie ne doivent pas etre vides lorsque les signaux 
SIGINT ou SIGQUIT sont declenches par le terminal. Ceci s'applique aussi au buffer d'entree seul, 
avec le signal SIGSUSP. 


PENDIN 


Avec cet attribut, qui est une extension BSD et Systeme V, la frappe d'une touche oblige a reafficher 
tous les caracteres qui ne sont pas encore lus. 


TOSTOP 


Cet attribut indique qu'un processus en arriere-plan qui tente d'ecrire sur son terminal de controle 
recevra le signal SIGTTOU. Nous avons observe ce phenomene dans le chapitre 6. 
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Membre c_cc[ ] de la structure termios 

Finalement, ce membre contient une table de NCCS valeurs, representant pour la plupart des 
caracteres ayant des fonctions particulieres. II existe des constantes pour acceder aux diffe- 
rents indices dans cette table. 

Voyons tout d'abord les caracteres speciaux definis par c_cc[]. 



Norn 


Defaut 


Signification 


DISCARD 


A o 


Ce caractere peut etre configure dans c_cc[VDISCARD]. Si lasaisie etendue IEXTEN est 
configured dans c_l f 1 ag, ce caractere desactive I'ecriture jusqu'a I'arrivee d'un second 
DISCARD. 


EOF 


A d 


Ce caractere peut etre configure dans c_cc[VE0F]. En mode canonique, il indique la fin 
d'une saisie. Lappel-systeme read( ) se termine en renvoyant zero octet. 


EOL 




Ce caractere peut etre configure dans c_cc[VE0L]. II s'agit d'un second caractere de 
saut de ligne en mode canonique. 


E0L2 




Ce caractere peut etre configure dans c_cc[VE0L2]. II s'agit encore d'un caractere sup- 
plemental indiquant la fin de ligne. 


C D A Q c 


n 


Ce caractere peut etre configure dans c_cc[VERASE]. II permet, en mode canonique, 
d'effacer le dernier caractere saisi. Si le debut de ligne est atteint, il n'a pas d'effet. 


T MTD 
1 n I t\ 


A n 


uc OdldClclG pcUl cllc CUIII lyUI c Udllb L_LL L V In 1 l\J . Ol Idlll IUUL Ijlu UbL picbcl II Udl lb 

c_l f 1 ag, le signal SIGI NT est envoye aux processus du groupe en avant-plan au moment 
de sa reception. 


KILL 


A u 


Ce caractere peut etre configure dans c_cc[VKI LL], En mode canonique, il sert a effacer 

id nyiic Cll CUUIb. 


LNEXT 


"V 


Ce caractere peut etre configure dans c_cc[VLNEXT]. En mode canonique, avec 
I'attribut IEXTEN dans c_lfl ag, il sert a lire lavaleurdu caractere suivantqui est appuye 
sans I'interpreter. Par exemple la sequence A v A u affiche le caractere A u sans effacer la 
ligne. 


QUIT 


A \ 


Ce caractere peut etre configure dans c_cc[VQUIT]. Si I'attribut ISIG est actif, le signal 
SIGQUIT est envoye a tous les processus du groupe en avant-plan, ce qui par defaut les 

lei I [III lc dVUC UN 1 101 llcl LUIC. 


REPRINT 


A r 


Ce caractere peut etre configure dans c_cc[VREPRINT]. En mode canonique, si IEXTEN 
est active dans cj f 1 ag, ce caractere demande le reaffichage de la ligne complete. 


START 


"q 


Ce caractere peut etre configure dans c_cc[VSTART]. Si I'attribut IXON est configure 
dans c_i flag, ce caractere sert a redemarrer la lecture si elle etait bloquee. Si I'attribut 
IXOFF est present dans c_iflag, le pilote envoie automatiquement ce caractere vers le 
terminal lorsque le buffer d'entree se trouve a nouveau disponible. 


STOP 


A s 


Ce caractere peut etre configure dans c_cc[VSTOP]. II s'agit du caractere complemen- 
taire de START, servant a bloquer les ecritures s'il est resu et si I'attribut IXON est actif. De 
meme, il est envoye automatiquement au terminal lorsque le buffer d'entree est plein, si 
IXOFF est present. 


SUSP 


A z 


Ce caractere peut etre configure dans c_cc[VSUSPI Si I'attribut ISIG est present dans 
c_l f 1 ag et si le controle des jobs est actif, le signal SIGTSTP est envoye aux processus 
du groupe en avant-plan, ce qui suspend les processus sans les terminer. 


WERASE 


A w 


Ce caractere peut etre configure dans c_cc[VWERASE]. En mode canonique, avec 
I'attribut IEXTEN, ce caractere sert a effacer le dernier mot en reculant jusqu'a rencontrer 
un caractere non blanc, puis en effa$ant tous les caracteres jusqu'a un caractere blanc. 
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II existe deux caracteres speciaux qui ne peuvent pas etre modifies et qui n'ont done pas reel- 
lement d' emplacement dans la table c_cc[] : 



Norn 


Defaut 


Signification 


CR 


\r 


Ce caractere peut etre converti par le pilote de terminal en mode canonique, en fonction 
des attributs ICRNLou IGNCRdu membre c_iflag. 


NL 


\n 


En mode canonique, ce caractere sert a delimiter les lignes. En fonction de I'attribut 
INLCR du champ cjflag, il peut etre converti en \r. 



Les caracteres CR, EOL, E0L2 et NL sont les seuls qui peuvent etre renvoyes par un appel read( ) 
dans le mode canonique. Tous les autres caracteres de controle sont geres entierement par le 
pilote de terminal. Bien entendu, en mode brut, le pilote transmet tous les caracteres au 
processus lecteur. 

En plus de ces caracteres, la table c_cc [] contient deux valeurs numeriques : 

Indice Signification 

VTIME En mode non canonique, duree maximale d'attente d'un appel read (). Nous detaillerons ceci plus bas. 

VMIN En mode non canonique, nombre minimal de caracteres a renvoyer pour qu'un appel read( ) se 

termine avant le delai ci-dessus. 

Pour tester facilement toutes les options de configuration offertes par la structure termios, on 
peut utiliser le programme /bin/stty. Celui-ci travaille sur le descripteur de son entree stan- 
dard et affiche l'etat de la structure termios, ou nous permet de la modifier. Pour consulter 
tous les attributs termios, il faut utiliser stty -a. Meme lorsqu'il s'agit de transformer une 
option, stty travaille sur le descripteur de son entree standard, ce qui nous conduit a ecrire des 
choses comme 

$ stty -crtscts < /dev/ttySO 

pour supprimer le controle de flux materiel sur le premier port serie. 

En ce qui concerne le terminal « classique », stty permet de modifier pratiquement toutes les 
options termios en les faisant figurer sur la ligne de commande, eventuellement precedees 
d'un « - » pour les desactiver. II existe une option sane qui permet de retablir le terminal dans 
un etat normal. Pour faire des experiences avec stty, il faut eviter que le shell n' interfere, 
aussi avons-nous deux possibilites : 

• Utiliser un shell minimal, qui ne gere pas le clavier de maniere trop complete, a la maniere 
de /bin/ash. 

• Ecrire une petite application bouclant en lecture et en execution de ce type : 

while (fgetstchaine, MAX_CAN0N , stdin) != NULL) 
system(chaine) ; 

On se reportera a la page de manuel de stty pour voir toutes ces options. 

$ ash 
% stty -a 

speed 9600 baud; rows 0; columns 0; line = 0; 
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intr = A C; quit = A \; erase = A ?; kill = A U; eof = A D; eol = <undef>; 

eol2 = <undef>; start = A Q; stop = A S; susp = A Z; rprnt = A R; werase = A W; 

lnext = A V; flush = A 0; min = 1; time = 0; 

-parenb -parodd cs8 -hupcl -cstopb cread -clocal -crtscts 

-ignbrk -brkint -ignpar -parmrk -inpck -istrip -inlcr -igncr icrnl 

ixon -ixoff -iuclc -ixany -imaxbel 

opost -olcuc -ocrnl onlcr -onocr -onlret -ofill -ofdel nlO crO tabO 
bsO vtO ffO 

isig icanon iexten echo echoe echok -echonl -noflsh -xcase -tostop 
-echoprt echoctl echoke 
% stty istrip 

% (Pression sur eeg) : ihg 
ihg: not found 
% stty -onlcr 
% Is 

Makefile exemple_pty exemple_raw.c 

exemple_fl ush exemple_pty.c 

exemple_serie_l 

exemple_flush.c exempl e_raw exemple_serie_l.c 

% stty sane 

% Is 

Makefile exempl e_pty exempl e_raw.c 

exempl e_fl ush exempl e_pty.c exempl e_serie_l 
exempl e_fl ush. c exempl e_raw exempl e_serie_l.c 
% exit 



Basculement du terminal en mode brut 

Lorsqu'un terminal est initialise, il se trouve par defaut en mode canonique. II est possible de 
passer en mode brut en lisant la structure termios a l'aide de tcgetattr( ), puis de modifier la 
structure avant de la reecrire dans le terminal avec tcsetattr( ). 

Le passage en mode brut correspond aux operations suivantes : 

• Effacementdesattributs BRKINT, IGNBRK, ICRNL, IGNCR, PARMRK, INLCR, ISTRIP, IXON de c_if 1 ag, 
OPOST de c_oflag, ECHO, ECHONL, ICANON, IEXTEN, ISIG de cjflag et PARENB de c_cflag. 

• Configuration d'une taille de caractere CS8 dans c_cf 1 ag (apres en avoir efface le masque 
CSIZE). 

• Configuration de c_cc[VTIME] = 0 et c_cc[VMIN] = 1. 

Pour simplifier cette operation, on utilise done une fonction de bibliotheque nommee cfma- 
keraw( ), qui realise ces etapes. 

void cfmakeraw (struct termios * configuration); 

Un programme qui passe un terminal en mode brut doit s' assurer de restituer le mode cano- 
nique avant de se terminer. Pour cela, il sufHt de garder une copie de la structure termi os. 

Lorsqu'on demande une lecture sur un descripteur de terminal en mode brut, le comporte- 
ment est dicte par les variables c_cc[VMIN] et c_cc[VTIME]. La premiere correspond au 
nombre minimal de caracteres qui doivent etre lus pour que l'appel read( ) revienne avant que 
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son delai ne soit ecoule. Ce delai est indique en dixiemes de seconde dans la seconde variable. 
Les cas possibles sont done les suivants : 



C_CC[VMIN] 


C_CC[VTIME] 


Reaction a un read() 


0 


0 


L'appel-systeme read( ) revient immediatement. Si des caracteres sont disponi- 
bles, ils sont renvoyes tout de suite. 


> 0 


0 


L'appel read( ) ne revient que lorsque MIN caracteres au moins sont disponibles. 
Sinon, il peut bloquer indefiniment. 


0 


> 0 


L'appel-systeme ne durera qu'au plus TIME dixiemes de seconde. Si des carac- 
teres arrivent entre-temps, il se termine, sinon il renvoie 0 a I'expiration du delai. 


> 0 


> 0 


L'appel-systeme readO ne reviendra que si MIN caracteres sont regus ou si le 
delai de TIME dixiemes de seconde entre deux caracteres est ecoule. Le delai est 
reinitialise a I'arrivee de chaque nouveau caractere. Attention, le delai n'est pris 
en compte qu'apres I'arrivee du premier caractere. 



Nature llement, dans toutes ces situations read( ) peut se terminer avant Finstant indique s'il a 
lu le nombre de caracteres demandes en argument ou si un signal l'interrompt. 

En general, on utilisera : 

• Soit c_cc[VMIN] = 1 et c_cc[VTIME] = 0 pour avoir une lecture brute bloquante. Ceci 
permet par exemple d'implementer un editeur de texte, il s'agit de la configuration mise en 
place par cfmakeraw( ). 

• Soit c_cc[VMIN] = 0 et c_cc[VTIME] = 0 pour une lecture non bloquante, afin de laisser le 
programme se derouler en parallele, comme dans un jeu. 

Dans le programme suivant nous allons basculer en mode brut avec lecture non bloquante. En 
attendant que Futilisateur saisisse un caractere, le programme fait tourner une barre sur la 
gauche de la ligne de saisie. A chaque pression sur une touche, le code hexadecimal du carac- 
tere correspondant est affiche. Le programme se termine en appuyant sur « q ». 

exemple_raw.c : 

#include <stdio.h> 
#1nclude <termios.h> 
//include <unistd.h> 

struct termios sauvegarde; 

int initial isati on_cl a vi er (int fd); 
int restauration_clavier (int fd); 

int 
main (void) 
{ 

char c = 0; 
int i = 0; 

char * chaine = "-W | /" ; 

initialisation_clavier(STDIN_FILENO); 
while (1) { 
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if (read(STDIN_FILENO, & c, 1) == 1) 
if (c == -q") 
break; 

fprintf(stdout, "\r%c (%02X)", chained'], c); 

ff 1 ush(stdout) ; 

if (chaine[++ i] == '\0') 

i = 0; 
usleep(lOOOOO); 

} 

restauration_clavier(STDIN_FILENO) ; 
return EXIT_SUCCESS; 

} 

int 

initialisation_clavier (int fd) 

{ 

struct termios configuration; 
if (tcgetattr(fd, & configuration) != 0) 
return -1; 

memcpy(& sauvegarde, & configuration, sizeof (struct termios)); 

cfmakeraw(& configuration); 

configuration. c_cc[VMIN] = 0; 

if (tcsetattr(fd, TCSANOW, & configuration) != 0) 

return -1; 
return 0; 

} 

int 

restauration_clavier (int fd) 
{ 

tcsetattrtfd, TCSANOW, & sauvegarde); 
return 0; 

} 

Nous ne pouvons evidemment pas montrer d'exemple d'execution ici, puisque l'interet de ce 
programme est son comportement dynamique. 

On voit qu'avec ces fonctionnalites, il est possible de definir des routines a la maniere des 
kbhit( ), getch( ) ou getche( ) du monde Dos. Les touches de fonction (Fl, F2...), les fleches 
de deplacement ou les touches de controle (Inser, Suppr, etc.) renvoient des codes composes 
par plusieurs octets, generalement prefixes par OxlB (ESC). La gestion de ces touches est speci- 
fique au terminal et est peu portable. 

Pour utiliser toutes les possibilites d' action d'un clavier de maniere portable, il faudra se 
tourner vers les fonctionnalites curses, dont F implementation sous Linux est assuree par la 
bibliotheque ncurses. Cette bibliotheque donne acces a toutes les manipulations de texte en 
plein ecran. II existe de nombreuses applications utilisant ncurses, comme gdb, xwpe, vim, 
tel net, mc, etc. 

Avant d'essayer de modifier la configuration d'un descripteur, il convient de verifier s'il s'agit 
bien d'un terminal. Pour cela on utilise la fonction i satty( ) , declaree dans <uni std . h> : 



int isatty (int descripteur); 
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Cette fonction renvoie une valeur non nulle si le descripteur est bien un terminal. Dans ce cas 
il est possible d' employer la fonction ttynameO pour retrouver le nom du peripherique 
associe, par exemple /dev/ttySl. 

char * ttyname (int descripteur); 

La chaine renvoyee se trouve dans une zone de memoire statique. La bibliotheque GlibC 
propose egalement une version reentrante ttyname_r( ) : 

int ttyname_r (int descripteur, char * buffer, int longueur); 

Enfin, il existe une routine nommee ctermi d( ), permettant de recuperer le nom du terminal de 
controle du processus. II ne s'agit pas toujours du veritable nom du peripherique mais genera- 
lement de /dev/tty. Cette chaine est toutefois valide pour ouvrir un descripteur avec open( ). 

char * ctermid (char * chaine); 

Si le pointeur passe en argument est NULL, ctermid( ) renvoie une chaine de caracteres allouee 
dans une zone de memoire statique. Sinon, il stocke le nom dans le buffer transmis, lequel 
doit contenir au moins L_ctermid caracteres. 

Voyons quelques possibilites d' utilisation de ces routines. 
exemple_isatty.c : 

#include <stdio.h> 
#include <unistd.h> 

int 
main (void) 
{ 

if (isatty(STDIN_FILENO) ) 

fprintf(stdout, "stdin : %s\n" , ttyname ( STDIN_FI LENO ) ) ; 

el se 

fprintf (stdout, "stdin : Pas un terminal ! \n"); 
fprintf (stdout, "Terminal de controle : £s\n", ctermid (NULL)); 
return 0; 

} 

Voici un exemple d'execution depuis une connexion reseau par tel net : 

$ ./exemple_isatty 

stdin : /dev/pts/4 

Terminal de controle : /dev/tty 

$ ./exemple_isatty < exemple_isatty.c 

stdin : Pas un terminal ! 

Terminal de controle : /dev/tty 

$ 

Par contre, depuis une console virtuelle Linux : 

$ ./exemple_isatty 

stdin : /dev/tty2 

Terminal de controle : /dev/tty 

$ 
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L'interet essentiel de trouver le nom du terminal de controle est de pouvoir effectuer une 
saisie meme si l'entree standard a ete redirigee dans un fichier. La fonction getpassO, 
proposee par la bibliotheque GlibC permet de lire un mot de passe depuis le terminal de 
controle du processus. Cette routine est par exemple employee par /bin/su. 

char * getpass (const char * invite); 

Le message transmis en argument est affiche avant de lire le mot de passe. Naturellement, la 
bibliotheque C supprime l'echo sur le terminal durant la saisie. 

Pour connaitre ou modifier l'identite du groupe de processus se trouvant en avant-plan sur un 
terminal, on peut utiliser tcgetpgrp( ) et tcsetpgrp( ) : 

I pid_t tcgetpgrp (int descripteur) ; 

int tcsetpgrp (int descripteur, pi d_t groupe); 

Nous avons examine les notions de groupe de processus en avant-plan et de terminal de 
controle d'une session dans le chapitre 2. 



Connexion a distance sur une socket 



Lorsqu'on desire permettre a un utilisateur de se connecter a distance sur une application, il 
suffit de mettre en place un serveur TCP, comme nous F avons vu dans le chapitre precedent. 
On peut ecrire les messages a afficher sur le terminal de l'utilisateur dans la socket avec 
write ( ) et lire ses reponses avec read( ). L'utilisateur pourra se connecter avec telnet, par 
exemple pour administrer le logiciel a distance. 

Le programme suivant va tenter d'implementer tout ceci en utilisant dup2() pour rediriger 
l'entree et la sortie standard vers la socket de communication, puis en appelant system( ) sur 
les chaines de caracteres saisies. 

exemple_socket.c : 

//include <limits.h> 
//include <signal .h> 
//include <stdio.h> 
//include <stdlib.h> 
//include <string.h> 
//include <unistd.h> 

//include <arpa/inet.h> 
//include <netdb.h> 
//include <netinet/in.h> 
//include <sys/types . h> 
//include <sys/socket. h> 

void 

gestionnaire (int numero) 
{ 

exit(EXIT_SUCCESS); 
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void 

traite_connexion (int fd) 
{ 

char chaine [MAX_CAN0N] ; 
char * fin; 
FILE * fp; 

if ((fp = fdopentfd, "r+")) == NULL) { 
perror( "fdopen" ) ; 
exit(EXIT_FAILURE); 

} 

if (! isatty(fd)) { 

strcpy(chaine, "Vous n'etes pas connecte sur un terminal ! \n"); 
write(fd, chaine, strlen(chaine)); 

} 

dup2(fd, STD I N_FI LENO ) ; 
dup2(fd, STD0UT_FI LENO ) ; 
dup2(fd, STDERR_FI LENO ) ; 

while (fgetstchaine, MAX_CAN0N, fp) != NULL) { 
if ((fin = strpbrk(chaine, "\n\r")) != NULL) 

fin[0] = '\0' : 
if (strcasecmp(chaine, "fin") == 0) { 

kilKgetppidO, SIGINT); 

exit(EXIT_SUCCESS); 

} 

system(chaine) ; 

} 

exit(EXIT_SUCCESS); 



int 

main (void) 
{ 

int sock; 

int sock_2; 
struct sockaddr_in adresse; 

socklen_t longueur; 

if (signal (SIGINT, gestionnaire) != 0) { 
perror( "signal " ) ; 
exit(EXIT_FAILURE); 

} 

signal (SIGCHLD, SIG_IGN); 

if ((sock = socket(AF_INET, S0CK_STREAM, 0)) < 0) { 
perror( "socket" ) ; 
exit(EXIT_FAILURE); 

} 

memset(& adresse, 0, sizeof (struct sockaddr)); 
adresse. sin_family = AF_I NET ; 
adresse. sin_addr.s_addr = htonl (INADDR_ANY) ; 
adresse. sin_port = 0; 
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if (bind(sock, (struct sockaddr *) & adresse, 
sizeof (adresse) ) < 0) { 

perrorC'bind"); 
exi t( EXIT_FAI LURE) ; 

} 

longueur = sizeof (struct sockaddr_in) ; 
if (getsockname (sock, (struct sockaddr *) & adresse, 
& longueur) < 0) { 

per ror( "getsockname" ) ; 

exi t(EXIT_FAI LURE) ; 

} 

fprintf (stdout, "Mon adresse : IP = %s, Port = %u \n", 
inet_ntoa(adresse.sin_addr) , 
ntohs(adresse.sin_port) ) ; 

listen(sock, 5); 
while (1) { 

longueur = sizeof (struct sockaddr_in) ; 
sock_2 = accept(sock, & adresse, & longueur); 
if (sock_2 < 0) 

continue; 
switch (forkO) { 

case 0 : /* fils */ 
cl ose(sock) ; 

traite_connexion(sock_2) ; 
exit(EXIT_SUCCESS); 
default : 

cl ose(sock_2) ; 
break; 

} 

} 

cl ose(sock) ; 

return EXIT_SUCCESS; 

} 

Au debut, ce systeme semble fonctionner correctement, mais on s'apercoit assez vite de ses 
limites, notamment si on essaye d'invoquer une commande gerant l'ecran en entier, comme 
Fediteur vi , ou si on veut saisir un mot de passe cache : 

$ ./exemple_socket 

Mon adresse : IP = 0.0.0.0, Port = 1122 

$ telnet localhost 1122 

Trying 127.0.0.1. . . 

Connected to localhost. 

Escape character is * A ]'. 

Vous n'etes pas connecte sur un terminal ! 

Is 

Makefile 
exempl e_f 1 ush 
exemple_flush.c 
[...] 

exempl e_socket 
exempl e_socket.c 
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echo "un messige" 

un message 
su 

standard in must be a tty 
login 

login: nom 
Password: visible 
Login incorrect 
login: (Controle-D) 
Login incorrect 
login: (Controle-D) 
Login incorrect 
pwd 

/home/ccb/Doc/ProgLinux/Exemples/33 
fin 

Connection closed by foreign host. 
$ 

$ 

Nous voyons bien que le probleme qui se pose est que la liaison par reseau entre tel net - qui 
peut gerer un terminal correctement - et notre serveur n'est pas suffisante pour autoriser le 
fonctionnement normal d' applications manipulant l'ecran en mode brut. 

Pour resoudre ce probleme, nous devons faire appel a un pseudo-terminal. 

Utilisation d'un pseudo-terminal 

La notion de pseudo-terminal est souvent un peu confuse. II s'agit en fait d'un peripherique 
virtuel gere par le noyau, offrant deux moities distinctes : 

• Le pseudo-terminal maitre est un peripherique gere comme un descripteur de fichier habi- 
tuel, sur lequel on utilise open( ), read( ), write (), cl ose( ). 

• Le pseudo-terminal esclave est vu par les processus exactement comme un terminal 
normal. Tout ce qu'on ecrit sur le pseudo-terminal maitre est lisible sur l'esclave et, inver- 
sement, ce qui est ecrit sur le pseudo-terminal esclave est immediatement accessible du 
cote maitre. De plus, le noyau gere une discipline de ligne sur le pseudo-terminal esclave. 

Nous allons done pouvoir mettre en place le mecanisme decrit sur la figure 33.2 pour auto- 
riser des connexions reseau completes. 

Pendant longtemps Faeces aux pseudo-terminaux se faisait en ouvrant directement des des- 
cripteurs particuliers : /dev/ptyXN pour les terminaux maitres, et /dev/ttyXN pour les pseudo- 
terminaux esclaves, ou X correspondait a une lettre dans Fensemble « pqrstuvwxyzabcde » et 
N a un chiffre hexadecimal compris entre 0 et F. 

A partir du noyau Linux 2.2, les pseudo-terminaux dits devpts ont fait leur apparition, confor- 
mement aux specifications Unix 98. Les pseudo-terminaux sont maintenant situes dans /dev/ 
pts, a condition qu'une pseudo-partition de type devpts soit montee sur ce repertoire. 

Pour ouvrir un pseudo-terminal, on commence par invoquer la routine getpt( ), une extension 
Gnu declaree dans <stdl i b . h> : 

int getpt (void); 
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Figure 33.2 

Utilisation d'un pseudo-terminal pour des connexions externes 



Shell 



stdin, 
stdout, 
stderr 



Cette routine renvoie un descripteur de fichier correspondant au pseudo-terminal maitre. Pour 
l'obtenir, elle demande au noyau d'ouvrir le fichier special /dev/ptmx. Voyant cela, le noyau 
lui attribue un descripteur d'un nouveau pseudo-terminal maitre. 

Une fois l'ouverture effectuee, il est necessaire de modifier les droits d'acces au pseudo- 
terminal esclave - le seul qui sera vraiment visible dans 1' arborescence du systeme de 
fichiers. Pour cela on appelle la fonction grantpt( ) en lui transmettant le descripteur du cote 
maitre. Cette fonction est definie par SUSv3. 

int grantpt (int descripteur); 

Pour etre stir d'etre portable, un programme doit ensuite appeler la routine unlockptO, qui 
permet de deverrouiller le pseudo-terminal esclave associe au descripteur maitre. 

int unlockpt (int descripteur); 

Finalement, pour pouvoir ouvrir le pseudo-terminal esclave, il faut obtenir son nom dans le 
systeme de fichiers. Ceci est assure par la fonction ptsname( ), qui renvoie un pointeur sur une 
chaine de caracteres en memoire statique contenant le nom du pseudo-terminal esclave 
associe au descripteur maitre passe en argument. 

char * ptsname (int descripteur); 

II existe une extension Gnu reentrante nommee ptsname_r( ) : 

int ptsname_r (int descripteur, char * buffer, size_t longueur); 

II ne faut pas etre effraye par la multitude de routines a invoquer successivement. L' utilisation 
des pseudo-terminaux repond a un schema bien defini, qu'on reutilise directement dans 
chaque application. 

Le principe de notre programme est le suivant : 

• Le processus pere ouvre un pseudo-terminal maitre disponible. Ensuite il passe son 
pseudo-terminal en mode brut afin de ne pas interferer avec les echanges de donnees. 
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• Le fils ouvre le pseudo-terminal esclave associe au maitre. II en fait son terminal de 
controle et le duplique sur l'entree et la sortie standard. Enfin il execute un shell. 

• Le processus pere copie directement ce qu'il recoit sur sa socket de communication vers le 
pseudo-terminal maitre, et inversement. 



Attention 

Ce programme offre, sans verification d'identite, un acces immediat a la machine. Ne I'utilisez done que sur 
une station se trouvant sur un reseau local sur ou sur un compte utilisateur experimental et sans privileges. 



Dans la description ci-dessus, le processus pere considere est deja obtenu par un f ork( ) apres 
l'etablissement de la connexion reseau. Nous avons done deux niveaux de relations pere-fils, 
mais nous ne nous interessons ici qu'a la seconde, qui concerne les deux moities du pseudo- 
terminal. 

exemple_pty.c : 

//define _GNU_SOURCE 500 

#incl ude <fcntl .h> 
//include <limits.h> 
//include <signal .h> 
//include <stdio.h> 
//include <stdlib.h> 
//include <string.h> 
//include <termios.h> 
//include <unistd.h> 

//include <arpa/inet.h> 
//include <netdb.h> 
//include <netinet/in.h> 
//include <sys/types.h> 
//include <sys/socket.h> 

void 

copie_entrees_sorties (int fd, int sock) 
{ 

int max; 
fd_set set; 
char buffer[4096] ; 
int nb_lus; 

max = sock < fd ? fd : sock; 
while (1) { 

FD_ZER0(& set); 

FD_SET(sock, & set); 

FD_SET(fd, & set); 

if (select(max + 1, & set, NULL, NULL, NULL) < 0) 
break; 

if (FD_ISSET(sock, &set)) { 
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if ((nbjus = readtsock, buffer, 4096)) >= 0) 
writetfd, buffer, nb_lus); 

el se 

break; 

} 

if (FD_ISSET(fd, &set)) { 

if ((nbjus = read(fd, buffer, 4096)) >= 0) 
writetsock, buffer, nb_lus); 

el se 

break; 

} 

} 

} 

void 

traite_connexion (int sock) 
{ 

int fd_maitre; 

int fd_esclave; 

struct termios termios_stdin; 

struct termios termiosjaitre; 

char * args[2] = { Vbin/sh", NULL }; 

char * nom_escl ave; 

if ((fdjaitre = getptO) < 0) { 

perrorC'pas de Pseudo TTY Unix 98 disponibles \n"); 
exi t( EXIT_FAI LURE) ; 

} 

grantpt(fd_maitre) ; 
unlockpt( fdjaitre) ; 
nom_esclave = ptsname(fdjaitre) ; 
tcgetattr(STDIN_FILEN0, & termios_stdin) ; 
switch (forkO) { 
case -1 : 

perror( "fork" ) ; 

exi t(EXIT_FAI LURE); 
case 0 : /* fils */ 

close(fd_maitre) ; 

/* Detachement du terminal de controle precedent */ 
setsid( ) ; 

/* Ouverture du pseudo-terminal esclave qui devient */ 
/* alors le terminal de controle de ce processus. */ 
if ((fd_esclave = open (nom_escl ave, 0_RDWR)) < 0) { 

perror( "open" ) ; 

exi t(EXIT_FAI LURE); 

} 

tcsetattr(fd_esclave, TCSAN0W, & termios_stdin) ; 
dup2(fd_esclave, STDI N_FI LEN0) ; 
dup2(fd_esclave, STD0L)T_FI LEN0 ) ; 
dup2(fd_esclave, STDERR_FI LEN0 ) ; 
execv(args[0] , args); 
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break; 
default : 

tcgetattr(fd_maitre, & termios_maitre) ; 
cfmakeraw(& termios_maitre) ; 
tcsetattr(fd_maitre, TCSANOW, & termios_maitre) ; 
copie_entrees_sorties(fd_maitre, sock) ; 
exit(EXIT_SUCCESS); 

} 

} 

La fonction mainO reste inchangee par rapport au programme precedent. L' execution du 
programme et la connexion reseau se deroulent deja mieux qu'auparavant : 

$ . /exemple_pty 

Mon adresse : IP = 0.0.0.0, Port = 1231 

$ telnet 192.1.1.51 1231 
Trying 192.1.1.51... 
Connected to 192.1.1.51. 
Escape character is * A ]*. 
$ tty 
tty 

/dev/pts/7 
$ 

$ su 

Sli 

Password: Visible ! 

su: incorrect password 
$ 

$ exit 

exit 
exit 

Connection closed by foreign host. 
$ 

Le terminal de controle du shell lance est bien dirige vers un pseudo-terminal esclave, /dev/ 
pts/7 en 1' occurrence. Nous remarquons toutefois un premier probleme : les symboles d'invi- 
tation du shell ($) sont doubles. De plus, les commandes saisies sont repetees avant d'etre 
executees. Un second probleme se presente avec la saisie du mot de passe qui continue a etre 
visible. II y a done un reglage de l'echo local qui n'est pas correct. Quant a l'utilisation d'un 
programme interactif comme vi, elle est tres fortement perturbee (meme si le processus a 
l'impression de travailler correctement sur un terminal). 

Le veritable probleme vient en fait de l'application tel net. Celle-ci est confue pour dialoguer 
avec le demon tel netd et pas avec n'importe quel processus de connexion. Notre programme 
ne respecte pas le protocole TELNET (decrit entre autres dans la RFC 854). 

Nous pouvons toutefois obtenir un resultat satisfaisant en ecrivant notre propre processus 
client, qui copiera son entree standard vers une socket reseau, et inversement copiera le 
contenu de la socket sur sa sortie standard. II nous suffit de reprendre le programme tcp_2_ 
stdout.c du chapitre precedent, dont nous modifions quelque peu la fonction main( ). 
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client pty.c : 

int 

main (int argc, char * argv[]) 

{ 

int sock; 

struct sockaddr_in adresse; 

char buffer[LG_BUFFER]; 

int nb_lus; 

struct termios termios_stdin, termios_raw; 

fd_set set; 

if (lecture_arguments(argc, argv, & adresse, "tcp") < 0) 

exit(EXIT_FAILURE); 
adresse. si n_f ami ly = AF_I NET ; 

if ((sock = socket(AF_INET, S0CK_STREAM, 0)) < 0) { 
perror( "socket" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

if (connect(sock, & adresse, sizeof (struct sockaddr_in) ) < 0) { 
perror( "connect" ) ; 
exi t(EXIT_FAI LURE); 

} 

tcgetattr(STDIN_FILENO, & termios_stdin) ; 
tcgetattr(STDIN_FILENO, & termios_raw) ; 
cfmakeraw(& termios_raw) ; 

tcsetattr(STDIN_FILENO, TCSANOW, & termi os_raw) ; 

while (1) { 

FD_ZER0(& set); 
FD_SET(sock, & set); 
FD_SET( STDI N_FI LENO , & set); 

if (select(sock + 1, & set, NULL, NULL, NULL) < 0) 
break; 

if (FD_ISSET(sock, & set)) { 

if ((nbjus = readtsock, buffer, LG_BUFFER) ) <= 0) 
break; 

wri te( STD0UT_FI LENO , buffer, nbjus); 

} 

if ( FD_ISSET( STDI N_F I LENO , & set)) { 

if ((nbjus = read(STDIN_FILEN0, buffer, LG_BUFFER) ) <= 0) 
break; 

writetsock, buffer, nb_lus); 

} 

} 

tcsetattr(STDIN_FILEN0, TCSANOW, & termios_stdin) ; 
return EXIT_SUCCESS; 

} 

Nous avons pris soin de basculer le terminal sur lequel s'execute le client en mode non cano- 
nique, afin de laisser le shell se trouvant a 1' autre extremite de la chaine responsable de la 
gestion de l'ecran. 
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Nous avons done realise un arrangement correspondant a la figure 33.3. 



Figure 33.3 
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L' execution cette fois-ci est parfaitement concluante, tous les programmes fonctionnent 
normalement, y compris les editeurs plein ecran comme vi ou des saisies de mot de passe 
cache. 

$ . /exemple_pty 

Mon adresse : IP = 0.0.0.0, Port = 1233 

$ ./client_pty -a 192.1.1.51 -p 1233 
$ tty 

/dev/pts/7 
$ su 

Password: 

# tty 
/dev/pts/7 

# exit 
$ exit 
exit 

$ 

(Controle-C) 

$ 

Nous avons pu obtenir un systeme assez interessant en utilisant des pseudo-terminaux pour 
offrir une possibility de connexion distante. Nous allons examiner maintenant le dernier type 
principal d' utilisation des terminaux Unix : les liaisons serie. 



Gestion du terminal 

Chapitre 33 



Configuration d un port serie RS-232 

L' exploitation des ports serie d'un PC sous Linux peut etre envisagee pour de nombreuses 
raisons. Voici quelques exemples d'application que j'utilise frequemment : 

• Modem externe : ces modems ont en effet de nombreux avantages par rapport a leurs 
homologues internes, ne serait-ce que Faffichage visible de l'etat des lignes de controle. 
On peut facilement les installer en rack dans des baies industrielles, et leur reinitialisation 
se fait sans arret de la machine. 

• Appareil photographique numerique : 1' application Gimp est tres puissante en ce qui 
concerne le traitement des images, et de surcroit le rapatriement des photographies par 
cable serie est nettement plus rapide avec des utilitaires sous Linux qu'avec les drivers 
d'origine livres avec 1' appareil. 

• Imprimante : on trouve facilement des imprimantes d' occasion a ruban qui ont ete rempla- 
cees par des imprimantes laser. Ces anciens modeles disposaient en general d'un systeme 
d'entrainement a picot permettant d'imprimer du listing au kilometre. Cette possibilite est 
tres precieuse pour le developpeur, car la lecture d'un programme est plus coherente sur 
ces feuilles en continu. Ces modeles d' imprimante existent souvent en version serie, ce qui 
permet de conserver le port parallele pour une imprimante bureautique plus classique. 

• Cable de liaison : lors d' interventions sur des sites clients, il n'est pas toujours possible de 
connecter un ordinateur portable sur le reseau pour transferer des donnees, ceci pour des 
raisons de securite. La solution la plus simple pour transmettre des fichiers source est une 
liaison directe entre le port serie du portable et celui de la station de destination. La mise en 
ceuvre, nous le verrons, est facile et n'est generalement pas consideree comme une atteinte 
a la securite du systeme du client. 

• Peripheriques divers : l'interface RS-232 etant bien connue, assez performante et souple 
d' utilisation, il est frequent de la rencontrer dans du materiel fabrique specifiquement pour 
un developpement « maison ». J'ai utilise cette interface pour communiquer avec des equi- 
pements allant du recepteur GPS a 1' automate programmable, en passant par des centrales 
d'alarme ou des programmateurs de chauffage. 



Meme si depuis la premiere edition de ce livre, I'utilisation des ports RS-232 a diminue au profit des ports 
USB, j'ai decide de conserver ce paragraphe, car il existe encore de nombreux systemes installes qui utilisent 
ce type de peripheriques. Bien que les nouveaux ordinateurs ne soient pas toujours equipes de ports RS-232, 
des convertisseurs USB/RS-232 existent (et fonctionnent parfaitement sous Linux) qui nous permettent 
encore de realiser ce genre de liaison. 

Les ports serie se presentent sur l'ordinateur sous forme de connecteurs males a 9 ou 
25 broches, dont les noms sont indiques sur la figure 33.4. 

L'acces aux ports est possible en utilisant les fichiers speciaux en mode caractere /dev/ttySO, 
/dev/ttySl. . ., ainsi que /dev/cuaO, /dev/cual... Les fichiers /dev/ttySO et /dev/cuaO corres- 
pondent au premier port serie de F unite centrale (note port A, COM1 . ..), /dev/ttySl et /dev/ 
cual au second port, et ainsi de suite. 

La difference entre les fichiers / dev/ttySx et /dev/cuax apparait lors de l'ouverture du port. Si 
le port n'est pas configure en mode local (option CLOCAL dans le membre c_cf 1 ag de la struc- 
ture termios), l'ouverture d'un peripherique /dev/ttySx est bloquante en attendant que 
sabroche CD (detection de porteuse) passe a 1. Si le port est local, l'ouverture n'est pas 
bloquante. De meme, l'ouverture de /dev/cuax n'est jamais bloquante. 
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Figure 33.4 
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L'emploi des peripheriques /dev/cuax est a present deconseille, il vaut mieux proceder en 
ouvrant le port /dev/ttySx correspondant de maniere non bloquante. En fait, /dev/cuax etait 
reserve aux processus effectuant des connexions sortantes a l'aide d'un modem. L'ouverture 
ne devait pas etre bloquante, meme si aucune porteuse n' etait detectee, car il fallait pouvoir 
demander au modem de realiser la numerotation. 

Nous respecterons les nouvelles consignes d'utilisation des ports serie sous Linux en 
employant uniquement les /dev/ttySx. 

Le premier probleme est de trouver quel fichier special correspond a tel ou tel connecteur. 
Cela est evident lorsque les ports sont numerates sur le panneau arriere du PC, mais 
lorsqu'une dizaine de machines sont installees en rack et reliees a des prolongateurs serie de 
plusieurs metres passant dans un faux plancher, l'etiquetage devient plus problematique. Pour 
cela, on peut toutefois utiliser les signaux de controle de la ligne. Lors de l'ouverture d'un 
port serie, l'ordinateur eleve les signaux RTS et DTR. Nous pouvons done observer la modi- 
fication electrique sur le connecteur au moyen d'un voltmetre ou d'un testeur a LED. Les 
tensions utilisees sur une prise RS-232 sont considerees comme des 0 logiques si elles sont 
inferieures a -3 V, et comme des 1 logiques si elles sont superieures a +3 V, ceci par rapport a 
la borne SG de masse des signaux. 

Notre premier programme va done ouvrir le port indique en argument de maniere non 
bloquante, puis le refermer en indiquant au fur et a mesure les tensions qu'on doit mesurer sur 
le connecteur. 
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exemple_serie.c : 

#include <sys/types.h> 

#include <sys/stat.h> 

#include <fcntl .h> 

#include <stdio.h> 

#include <unistd.h> 



int 

main (int argc, char * argv[]) 
{ 

int fd; 

char chaine[2]; 



if (argc != 2) { 

fprintf (stderr, "%s < fichier special >\n", argv[0]); 
exi t( EXIT_FAI LURE) ; 

} 

fprintf (stdout, "Verifiez la tension entre les broches \n" 

" 7 (-) et 20 (+) pour un connecteur DB-25 \n" 
" 5 (-) et 4 (+) pour un connecteur DB-9 \n \n "); 
fprintf (stdout, "La tension doit etre inferieure a -3 V \n"); 
fprintf (stdout, "Pressez Entree pour continuer \n"); 
fgetstchaine, 2, stdin); 
fd = open(argv[l], 0_RD0NLY | 0JI0NBL0CK); 
if (fd < 0) { 

perrorC'open"); 

exi t(EXIT_FAI LURE); 

} 

fprintf (stdout, "La tension doit etre superieure a +3 V \n"); 
fprintf (stdout, "Pressez Entree pour continuer \n"); 
fgetstchaine, 2, stdin); 

fprintf (stdout, "La tension doit etre a nouveau < -3 V \n"); 
if (close(fd) < 0) { 

perror( "cl ose" ) ; 

exi t( EXIT_FAI LURE) ; 

} 



return EXIT_SUCCESS; 

} 

Pour mesurer la tension sur un connecteur serie a Faide d'un voltmetre, il est souvent plus 
facile d'y enficher un connecteur a souder de l'autre genre, sans cablage. Les bornes a souder 
se trouvant au dos de ce connecteur peuvent accueillir les pointes de mesure du voltmetre en 
evitant les derapages constants. 

II faut noter que les fichiers speciaux de peripheriques comme /dev/ttySO disposent d'autori- 
sations d'acces souvent restrictives. Pour continuer nos experiences, il faut modifier les 
permissions pour donner Faeces a tous les utilisateurs (a eviter sur un systeme public), ou 
creer un groupe particulier ayant les droits de lecture et ecriture et inscrire dans ce groupe les 
utilisateurs habilites a manipuler le port serie. 
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A present que nous avons trouve le connecteur correspondant a notre fichier special, nous 
allons essayer de transferer des fichiers d'un ordinateur a F autre. Pour cela il faut configurer 
les divers elements de la liaison serie : 

• La parite est configuree par Fassociation des options PARENB et PARODD du membre c_cf 1 ag 
de la structure termios. 

• Le nombre de bits de donnees est defini par les options CS5, CS6, CS7 ou CS8 du champ c_ 
cf 1 ag. Avant de fixer une valeur, on efface tous les bits correspondant a ces options a l'aide 
du masque CSIZE. 

• Le nombre de bits d' arret est fourni par l'option CSTOPB du membre c_cf 1 ag. 

• La vitesse de transmission est en realite contenue dans le champ c_cflag, mais on utilise 
des routines specialisees pour la lire ou la configurer. 

Les fonctions cfsetispeed( ) et cfsetospeed( ) permettent de configurer la vitesse d'entree ou 
de sortie dans la structure termios passee en argument. 

int cfsetispeed (struct termios * configuration, speed_t vitesse); 
int cfsetospeed (struct termios * configuration, speed_t vitesse); 

Le type speed_t represente la vitesse et peut prendre l'une des valeurs suivantes : 

BO, B50, B75, B110, B134, B150, B200, B300, B600, B1200, B1800, B2400, B4800, B9600, B19200, 
B38400, B57600 ou Bl 1 5200. Naturellement, chaque constante represente la vitesse correspon- 
dante mesuree en bits par seconde. La vitesse BO sert a forcer le raccrochage d'un modem. 

Pour lire la vitesse configuree dans une structure termi os, on peut employer cfgeti speed( ) ou 
cfgetospeed( ) : 

speed_t cfgetispeed (struct termios * configuration); 
speed_t cfgetospeed (struct termios * configuration); 

Pour faire dialoguer deux ordinateurs, nous utiliserons le meme principe que ce que nous 
avions elabore avec les sockets UDP, en transferant sur une liaison serie le contenu de F entree 
standard, et inversement depuis la liaison vers la sortie standard. 

Le programme suivant va recopier son entree standard vers un port serie indique en argument. 
On commence par ouvrir le fichier special de maniere non bloquante pour supprimer Fattribut 
local du port, puis on le referme. Lors de la seconde ouverture, le processus attendra que sa 
broche CD indique qu'une porteuse a ete detectee. 

stdin_2_serie.c : 

#incl ude <fcntl .h> 
#include <stdio.h> 
//Include <termios.h> 
//include <unistd.h> 

//define LG_BUFFER 1024 

void 

setspeed (struct termios * config, speed_t vitesse) 
{ 

cfsetispeed (config, vitesse); 
cfsetospeed (config, vitesse); 

} 



Gestion du terminal 




Chapitre 33 



int 

main (int argc, char * argv[]) 



char * 



nom_tty = " 

Vitesse = 9 

type_parite = ' 

nb_bits_donnees = 8 

nb_bits_arret = 1 

fd_tty = - 

termios configuration; 

termios sauvegarde; 



Vdev/ttySO" ; 
9600; 
'n ' ; 



i nt 
int 
int 
int 
int 



8; 
1; 
-1; 



struct 
struct 



char 
i nt 
i nt 



buffer[LG_BUFFER] ; 

nb_l us ; 

option; 



opterr = 0; 

while ((option = getopt(argc, argv, "hv:p:d:a:t:")) != -1) { 
switch (option) { 
case 'v' : 

if ( (sscanf (optarg, "%d" . & vitesse) != 1) 
|| (vitesse < 50) || (vitesse > 115200)) { 

fprintf (stderr, "Vitesse %s invalide \n", optarg); 
exit(EXIT_FAILURE); 

} 

break; 
case 'p' : 

type_parite = optarg[0]; 

if ( (type_parite ! = 'n') && (type_parite != 'p') 
&& (type_parite ! = 'i')) { 

fprintf (stderr, "Parite %c invalide \n". 



exit(EXIT_FAILURE); 

} 

break; 
case 'd' : 

if ( (sscanf (optarg, "%d" , & nb_bits_donnees) != 1) 
[| (nb_bits_donnees < 5) || (nb_bits_donnees > 8)) { 
fprintf (stderr, "Nb bits donnees %d invalide \n". 



exit(EXIT_FAILURE); 

} 

break; 
case 'a' : 

if ( (sscanf (optarg, "Jjd". & nb_bits_arret) ! = 1) 

|| (nb_bits_arret < 1) || (nb_bits_arret > 2)) { 

fprintf (stderr, "Nb bits arret %d invalide \n", 



type_parite) ; 



nb_bits_donnees) ; 



nb_bits_arret) ; 



exit(EXIT_FAILURE); 



break; 



902 



Programmation systeme en C sous Linux 



case 'V : 

nom_tty = optarg; 
break; 

case 'h' : 

fprintf (stderr, " 
fprintf (stderr, " 
fprintf (stderr, " 
fprintf (stderr, " 



Syntaxe %s [options].. 
Options : \n"); 



fprintf (stderr, " 
fprintf (stderr, " 
fprintf (stderr, " 
exit(EXIT_SUCCESS); 
default : 

fprintf (stderr, "Option 
exit(EXIT_FAILURE); 



\n", argv [0]); 



\n") 



-v <vitesse en bits/seconde> 
-p <parite> (n)ulle (p)aire " 
( i )mpai re \n" ) ; 
-d <bits de donnees> (5 a 8) \n"); 
-a <bits d'arret> (1 ou 2) \n"); 
-t <nom du peripherique> \n"); 



-h pour avoir de 1 'aide \n") 



/* Ouverture non bloquante pour basculer en mode non local */ 
fd_tty = open(nom_tty, 0_RDWR | OJJONBLOCK); 
if (fd_tty < 0) { 

perror(nom_tty ) ; 

exit(EXIT_FAILURE); 

} 

if (tcgetattr(fd_tty , & configuration) != 0) { 
perror( "tcgetattr" ) ; 
exit(EXIT_FAILURE); 

} 

configuration. c_cflag &= ~ CLOCAL; 
tcsetattr(fd_tty, TCSANOW, & configuration); 

/* Maintenant ouverture bloquante en attendant CD */ 
fd_tty = open(nom_tty, 0_RDWR); 
if (fd_tty < 0) { 

perror(nom_tty ) ; 

exit(EXIT_FAILURE); 



fprintf (stderr, "Port serie ouvert \n"); 
tcgetattr(fd_tty , & configuration); 

memcpy(& sauvegarde, & configuration, sizeof (struct termios)); 
cfmakeraw(& configuration); 
if (Vitesse < 50) 

75) 



on, B50); 
on, B75); 



setspeed(& configurati 

else if (vitesse < 75) setspeed(& configurati 

else if (vitesse < 110) setspeed(& configuration, B110); 

else if (vitesse < 134) setspeed(& configuration, B134); 

else if (vitesse < 150) setspeed(& configuration, B150); 

else if (vitesse < 200) setspeed(& configuration, B200); 

else if (vitesse < 300) setspeed(& configuration, B300); 

else if (vitesse < 600) setspeed(& configuration, B600); 

else if (vitesse < 1200) setspeed(& configuration, B1200) 

else if (vitesse < 1800) setspeed(& configuration, B1800) 

else if (vitesse < 2400) setspeed(& configuration, B2400) 
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else if (Vitesse < 4800) 
else if (vitesse < 9600) 
else if (vitesse < 19200) 
else if (vitesse < 34000) 
else if (vitesse < 57600) 
el se 

switch (type_parite) { 
case 'n' : 

conf i gurati on . c_cf 1 ag 

break; 
case 'p' : 

conf i gurati on . c_cf 1 ag 

conf i gurati on . c_cf 1 ag 

break; 
case 'i': 

conf i gurati on . c_cf 1 ag 

conf i gurati on . c_cf 1 ag 

break; 



setspeed(& 
setspeed(& 
setspeed(& 
setspeed(& 
setspeed(& 
setspeed(& 



configuration, 
configuration, 
configuration, 
configuration, 
configuration, 
configuration, 



B4800); 
B9600); 
B19200) 
B38400) 
B57600) 
B115200) 



&= ~ PARENB; 



PARENB; 
PAR0DD; 



PARENB; 
PAR0DD; 



configuration. c_cflag &= 


~ CSIZE; 










if (nb_bits_donnees == 5) 




configuration 


c_ 


_cflag 


|= CS5; 


else if (nb_bits_donnees 


== 6) 


configuration 


c_ 


_cflag 


|= CS6; 


else if (nb_bits_donnees 


== 7) 


configuration 


c_ 


_cf 1 ag 


|= CS7; 


else if (nb_bits_donnees 


== 8) 


configuration 


c_ 


_cf 1 ag 


|= CS8; 


if (nb_bits_arret == 1) 




configuration 


c_ 


_cf 1 ag 


&= ~ CST0PB; 


el se 




configuration 


c_ 


.cflag 


|= CST0PB; 



configuration. c_cflag &= - CL0CAL; 
configuration. c_cflag | = HUPCL; 

/* Controle de flux CTS/RTS specifique Linux */ 
conf i gurati on. c_cf lag |= CRTSCTS; 

if (tcsetattr(fd_tty, TCSAN0W, & configuration) < 0) { 
perror( "tcsetattr" ) ; 
exi t( EXIT_FAI LURE) ; 

} 

fprintf (stderr, "Port serie configure \n"); 

fprintf (stderr, "Debut de 1 "envoi des donnees \n"); 
while (1) { 

nbjus = read(STDIN_FILEN0, buffer, LG_BUFFER) ; 
if (nbjus < 0) { 

perror( "read" ) ; 

exi t(EXIT_FAI LURE); 

} 

if (nbjus == 0) 
break; 

write(fd_tty , buffer, nb_lus); 

} 

fprintf (stderr, "Fin de 1 'envoi des donnees \n"); 
sleep(2) ; 
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cl ose(fd_tty ) ; 

/* restauration de la configuration originale */ 
fd_tty = open(nom_tty, 0_RDWR | 0_NONBLOCK); 
sauvegarde.c_cflag |= CLOCAL; 
tcsetattr(fd_tty, TCSANOW, & sauvegarde); 
cl ose(fd_tty ) ; 
return EXIT_SUCCESS; 

} 

Dans le programme serie_2_stdout.c, seule la partie centrale de la routine mainO a ete 
modifiee : 

serie_2 stdout.c : 

fprintf (stderr, "Debut de la reception des donnees \n"); 
while (1) { 

nbjus = read(fd_tty, buffer, LG_B U F F E R ) ; 
if (nbjus < 0) { 
perror( "read" ) ; 
exit(EXIT_FAILURE); 

} 

if (nbjus == 0) 
break; 

write(STD0UT_FILEN0, buffer, nbjus); 

} 

fprintf (stderr, "Fin de la reception des donnees \n"); 
cl ose(fdJty ) ; 

Pour se servir de ces utilitaires, il faut disposer d'un cable de liaison, dit Null-Modem, qui 
croise les lignes de donnees et de controle, et simule la detection de porteuse lorsque 1' autre 
ordinateur est pret. La figure 33.5 montre un exemple de ce cable, qu'on trouve parfois sous 
le nom de connexion DTE-DTE complete. 



Figure 33.5 

Cable Null-Modem complex 
avec brochage DB25 




7 


7 


2 


2 




3 


4 


4 


5 




5 


" 20 


20 


1 6 V 


6 


1 8 




8 


22 




22 







SG 

TX 

RX 

RTS 

CTS 

DTR 

DSR 

CD 

Rl 



Voici un exemple d' execution sur deux ordinateurs relies par leurs premiers ports serie : 

$ . /stdinj>_serie -t /dev/ttySO < stdinj>_serie.c 

$ . /serieJ>_stdout -t /dev/ttySO > stdinj>_serie.c 

Port serie ouvert 



Gestion du terminal 

Chapitre 33 



Port serie ouvert 

Port serie configure 
Port serie configure 

Debut de la reception des donnees 
Debut de 1 'envoi des donnees 
Fin de l'envoi des donnees 

Fin de la reception des donnees 

$ Is stdin_2_serie.c 

stdin_2_serie.c 

$ cksum stdin_2_serie.c 

2971580910 5399 stdin_2_serie.c 

$ 

$ Is stdin_2_serie.c 

stdin_2_serie.c 

$ cksum stdin_2_serie.c 

2971580910 5399 stdin_2_serie.c 
$ 

L'utilitaire cksum invoque ici calcule une somme de controle representant une sorte de signa- 
ture du fichier indique. On verifie ainsi aisement que les donnees ont bien ete transmises d'un 
ordinateur a F autre. Nos deux programmes ne representent que des exemples tres simplifies 
pour le transfert de fichiers. Si on voulait en faire de veritables outils serieux, il faudrait veri- 
fier les conditions d'erreur a la reception et utiliser un protocole permettant de demander a 
Femetteur de renvoyer a nouveau un paquet de donnees errone. 



Conclusion 

Nous avons examine dans ce dernier chapitre les aspects les plus utiles de la gestion des ter- 
minaux. En ce qui conceme l'utilisation de fonctionnalites etendues pour le terminal (edition 
plein ecran, etc.), on emploiera de preference la bibliotheque ncurses, qui offre de nombreuses 
possibilites et sait gerer l'essentiel des terminaux courants. 

Les lecteurs desireux d'approfondir le sujet sur les pseudo-terminaux pourront se tourner vers 
[STEVENS 1993] Advanced Programming in the UNIX Environment. 

Pour les liaisons serie, on trouvera des renseignements dans de nombreux ouvrages, en parti- 
culier dans [NELSON 1994] Communications serie, guide du developpeur C++, meme s'il est 
plutot oriente vers le monde Dos. La configuration de ces liaisons pour des terminaux Unix 
est abordee dans [Frisch 2003] Les bases de V administration systeme. 

Les liaisons RS-232 sont aussi decrites en detail dans les documents Linux Serial-HOWTO, 
Serial-Programming-HOWTO et Modems-HOWTO . 



Annexe 1 



Tables Ascii et ISO 8859-1/15 









Premiere moitie 


Ascii 








0x00 


\0 


Ctrl-A 


Ctrl-B 


Ctrl-C 


Ctrl-D 


Ctrl-E 


Ctrl-F 


\a 


0x10 


Ctrl-P 


Ctrl-Q 


Ctrl-R 


Ctrl-S 


Ctrl-T 


Ctrl-U 


Ctrl-V 


Ctrl-W 


0x18 


Ctrl-X 


Ctrl-Y 


Ctrl-Z 


(Esc) 










0x20 


Espace 


! 




# 


$ 


% 


& 




0x28 


~T 


~T~ 




+ 








/ 


0x30 


0 


1 


2 


3 


4 


5 


6 


7 


0x38 


8 


9 






< 




> 


? 


0x40 


@ 


A 


B 


C 


D 


E 


F 


G 


0x48 


H 


I 


J 


K 


L 


M 


N 


0 


0x50 


P 


Q 


R 


S 


T 


U 


V 


W 


0x58 


X 


Y 


Z 


~T 


\ 


~T~ 


A 




0x60 




a 


b 


c 


d 


e 


f 


g 


0x68 


h 


i 


j 


k 


I 


m 


n 


0 


0x70 


P 


q 


r 


s 


t 


u 


V 


w 


0x78 


X 


y 


z 


~r 


~r 


~T~ 




(DEL) 
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Seconde moitie : ISO 8859-1 








0x80 




0x88 




0x90 




0x98 




OxAO 






c 




if 


i 
i 


S 


0xA8 




© a 








® 




OxBO 




+ 2 


3 




M 


H 




0xB8 




1 0 


» 


% 


y 2 


% 


6 


OxCO 


A 


A A 


A 


A 


A 


/E 


Q 


0xC8 


E 


E E 


E 


I 


[ 


1 


T 


OxDO 


D 


N 6 


6 


0 


0 


0 


X 


0xD8 


0 


C) u 


0 


L) 


V 


t5 


R, 


OxEO 


a 


a a 


a 


a 


a 




S 


0xE8 


e 


e e 


e 


I 


i 


i 


T 


OxFO 


a 


n 6 


6 


6 


6 


6 




0xF8 


0 


u u 


u 


u 


y 




y 


Le codage ISO 8859-15 est un derive de 1'ISO 8859-1, auquel on a ajoute le symbole 
« Euro ». De plus quelques caracteres ont ete modifies dans les lignes suivantes : 


OxAO 


i t 


£ 


€ 


¥ 


g 


§ 


0xA8 


s 


© a 


« 


-1 




® 




OxBO 


± 2 


3 


Z 


M 


H 




0xB8 


z 


1 o „ 


CE 


ce 


Y 


6 
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Fonctions et appels-systeme 

etudies 



On trouvera ci-dessous une liste alphabetique des fonctions et des appels-systeme qui ont ete 
presentes au cours de cet ouvrage. On y trouvera aussi le numero du chapitre dans lequel on a 
etudie la fonction, avec une indication precisant s'il s'agit d'une fonction de la bibliotheque C 
ou d'un appel-systeme. On y signale egalement si la routine est mentionnee dans les normes 
courantes (Iso C9X, SUSv3). Les extensions specifiques Gnu sont relevees, ainsi que les 
fonctions desormais considerees comme obsoletes. 



Norn 


Chapitre 


Fonction Ap P el " lsoC9X SUSv3 Gnu Obsolete 
systeme 


abort 


5 




abs 


24 




accept 


32 




access 


21 




acos 


24 




acosh 


24 




adjtime 


25 




adjtimex 


25 




addmntent 


26 




aio_cancel 


30 




aio_error 


30 




aio_fsync 


30 
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Norn 


Chapitre Fonction 


Appel- 
systeme 


lsoC9X SUSv3 Gnu Obsolete 


ai o_read 


30 




• 


aio_return 


30 




• 


ai o_suspend 


30 




• 


aio_write 


30 




• 


al arm 


7 






al 1 oca 


13 




• 


al phasort 


20 






asctime 


25 




• 


asctime_r 


25 






asi n 


24 






asi nh 


24 






assert 


5 






atan 


24 






atan2 


24 






atanh 


24 






atexit 


5 






atof 


23 




• 


atoi 


23 






atol 


23 




• 


atoll 


23 




• 


basename 


15 




• 


bcmp 


15 




• 


bcopy 


15 




• 


bi nd 


32 


• 


• 


bi ndtextdomai n 


27 




• 


brk 


13 


• 




bsearch 


17 




• 


btowc 


23 




• 


bzero 


15 




• 


cabs 


24 






cacos 


24 




• 


cacosh 


24 






cal 1 oc 


13 






capget 


2 






capset 


2 






carg 


24 
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Norn 


Chapitre 


Fonction Ap f el " lsoC9X SUSv3 Gnu Obsolete 
sysleme 


ca s i n 


24 




ca s i nh 


24 




ca tan 


24 




ca tanh 


24 




ca t cl ns p 


27 




ca t apt s 


27 




ca t onpn 

V* U l/U L/C 1 1 


27 




chc crvnt 


16 




cb rt 


24 





ccos 


24 




ccns h 

*w *J O II 


24 




cei 1 


24 




C6Xp 


24 




cf apt i s nppd 

L- 1 MCI* 1 J L/CCU 


33 




cf apt nppd 


33 




cf ma kp caw 


33 




cf seti speed 


33 




cf setos peed 


33 




chdi r 


20 




chmod 


21 




chown 


21 




c h root 


20 




ci mag 


24 




r] pa rpn V 


3 




cl ea re rr 


18 




cl ock 


g 




cl og 


24 




cl one 


12 




close 


19 




cl ns pd i r 

C 1 WoCU 1 1 


20 




cl osel og 


26 




conj 


24 




connect 


32 




copysign 


24 




cos 


24 




cosh 


24 
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Norn 


Chapitre Fonction 


AoDel- 

lsoC9X SUSv3 Gnu Obsolete 

systeme 


cpow 


24 


• 


creal 


24 


• 


creat 


19 




crypt 


16 


• 


c ry pt_r 


16 


• 


csi n 


24 




csi nh 


24 




csqrt 


24 




ctan 


24 




ctanh 


24 




ctermid 


33 




ctime 


25 




ctime_r 


25 




cuserid 


26 




dbmcl ose 


22 




dbminit 


22 


• 


dbm_cl earerr 


22 


• 


dbm_cl ose 


22 


• 


dbm_del ete 


22 


• 


dbm_di rfno 


22 


• 


dbm_error 


22 


• 


dbm_fetch 


22 


• 


dbm_f i rstkey 


22 


• 


dbm_nextkey 


22 


• 


dbm_open 


22 


• 


dbm_pagfno 


22 


• 


dbm_rdonly 


22 


• 


dbm_store 


22 


• 


dbopen 


22 




del ete 


22 




des_setparity 


16 


• 


difftime 


25 




div 


24 




drand48 


24 




drand48_r 


24 




drem 


24 
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Norn 


Chapitre 


Fonction Ap f el " lsoC9X SUSv3 Gnu Obsolete 
sysleme 


dup 


19 




dup2 


19 




ebc crypt 


16 




ecvt 


23 




sc vt r 


23 




pnrrvnt 

CM 1 V U \j 


16 




pnrrvnt r 

CI 1 O 1 j U u 1 


16 




pnHf cpn t 

C 1 1 *J 1 JCM L 


26 




pndarpn t 

C 1 1 U M 1 CI 1 L 


26 




pnd hn^ t pn t 

C 1 1 li 1 1 \J O LCI 1 \j 


31 




pndmnt pnt 

Clllilllll LrCII \j 


26 




pndnpt pnt 

ClllillC Is C 1 1 


31 




pndnrnt npnt 

CIILiLJE U LUCII U 


31 




pndnwpnt 

C 1 1 *J L/ Vt C 1 1 1* 


26 




pnd ^ pnvpn t 

CI 1 U J C 1 VCIIL- 


31 




pnd u ^p hpl 1 

C 1 1 U U J C 1 JlIC 1 1 


26 




endutent 


26 




endutxent 


26 




erand48 


24 




erand48 r 


24 




erf 


24 




erf c 


24 




errno 


5 




execl 


4 




execl e 


4 




execl p 


4 




execv 


4 




execve 


4 




execvp 


4 




exi t 


5 




exi t 


5 




exp 


24 




exp2 


24 




explO 


24 




expml 


24 




fabs 


24 
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Norn 


Chapitre Fonction 


AoDel- 

*\" IsoC9X SUSv3 Gnu Obsolete 
systeme 


f chdi r 


20 


• 


f chmod 


21 


• 


f chown 


21 




fcl ose 


18 


• 


f cl oseal 1 


18 




fcntl 


19 




fcvt 


23 




fcvt_r 


23 


• 


fdatasync 


30 




fdopen 


18 


• 


feof 


18 




ferror 


18 




fetch 


22 




fflush 


18 




fgetc 


10 




fgetgrent 


26 




fgetgrent_r 


26 


• 


fgetpos 


18 




fgetpwent 


26 




fgetpwent_r 


26 




fgets 


10 


• 


fgetwc 


23 




fgetws 


23 


• 


f i 1 eno 


18 


• 


finite 


24 


• 


f i rst_key 


22 


• 


flock 


19 


• 


f 1 oor 


24 


• 


fmod 


24 


• 


fnmatch 


20 




fopen 


18 


• 


fork 


2 




fprintf 


10 




fputc 


10 




fputs 


10 




fputwc 


23 
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Norn 


Chapitre 


Fonction Ap f el " lsoC9X SUSv3 Gnu Obsolete 
sysleme 


f putws 


23 




f read 


18 




free 


13 




f reopen 


18 




f rexp 


24 




f cranf 

1 O U II 1 


10 




f seek 


18 





1 O C C I\.\J 


18 




f c pt nnc 


18 




f stat 


21 




f statf s 


26 




f sync 


19 




ftel 1 


18 




ftel 1 o 


18 




f t i me 


25 




ftok 


29 




f t r uncate 


21 




f tw 


20 




f wp r i n tf 


23 




f wscanf 


23 




f wr i te 


18 




gc vt 


23 





gdbm cl ose 


22 




gdbm del ete 


22 




gdbm exi s t 


22 




gdbm fdesc 


22 




gdbm fetch 


22 





gdbm f i rstkey 


22 




gdbm nextkey 


22 




ndhm onpn 

y u uii i \j yi c 1 1 


22 




gdbm_reorgani ze 


22 




gdbm_setopt 


22 




gdbnustore 


22 




gdbm_strerror 


22 




gdbm_sync 


22 




getc 


10 
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Norn 


Chapitre Fonction 


AoDel- 

'T IsoC9X SUSv3 Gnu Obsolete 
systeme 


getchar 


10 


• 


getcwd 


20 


• 


getdate 


25 


• 


getdate_r 


25 


• 


getdomainname 


26 




getegid 


2 




getenv 


3 


. . . 


geteuid 


2 




getf sent 


26 




getf sf i 1 e 


26 


• 


getf sspec 


26 




getgid 


2 




getgrent 


26 




getgrent_r 


26 




getgrgid 


26 




getgrgid_r 


26 




getgrnam 


26 


• 


getgrnam_r 


26 


• 


getgroups 


2 


• 


gethostbyaddr 


31 


• 


gethostbyaddr_r 


31 


• 


gethostbyname 


31 


• 


gethostbyname_r 


31 


• 


gethostbyname2 


31 


• 


gethostbyname2_r 


31 


• 


gethostent 


31 


• 


gethostid 


26 


• 


gethostname 


26 


• 


getitimer 


9 


• 


getl ine 


10 




getl ogi n 


26 


• 


getlogin_r 


26 




getmntent 


26 




getmntent_t 


26 




getnetbyaddr 


31 




getnetbyname 


31 
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getnetent 


31 • 




getopt 


3 




getopt long 


3 . 




getopt long only 


3 




apt na ^ ^ 


33 • 




apt npp rnanip 


32 




apt nai d 


2 




apt na rn 


2 




apt ni d 


2 




apt nni d 

y c l. y> yj i u 


2 




aptnrinritv 


1 -| 




aptnrntnhvnamp 


31 




apt nrot nhvnamp r 


31 • 




apt nrot ohvnumhpr 


31 




apt nrot nhvnumbpp r 


31 




apt nrot npnt 


31 




getprotoent r 


31 




getpt 


33 • 




getpwent 


26 




getpwent r 


26 • 




getpwnam 


26 




getpwnam r 


26 • 




getpwui d 


26 




getpwui d r 


26 • 




getresgid 


2 




getreswid 


2 




getrl imit 


9 




get rusage 


g 




get s 


10 




npt^prvhvnamp 


31 • 




getservbyname_r 


31 




getservbyport 


31 




getservbyport_r 


31 




getservent 


31 




getservent_r 


31 




gets id 


2 
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getsockname 


32 


• 


getsockopt 


32 


• 


getsubopt 


3 


• 


gettext 


27 


• 


getuid 


2 




getusershel 1 


26 




getutent 


26 




getutent_r 


26 




getutid 


26 




getutid_r 


26 




getutl i ne 


26 




getutl i ne_r 


26 




getutxent 


26 




getutxid 


26 




getutxl ine 


26 




getw 


18 


• 


getwc 


23 


• 


getwchar 


23 




getwd 


20 




gl ob 


20 




gl obf ree 


20 




gmtime 


25 


• 


gmtime_r 


25 




grantpt 


33 




hasmntopt 


26 


• 


hcreate 


17 




hcreate_r 


17 


• 


hdestroy 


17 




hdestroy_r 


17 




herror 


31 




hstrerror 


31 


• 


hsearch 


17 




hsearch_r 


17 




htonl 


31 




htons 


31 




hypot 


24 
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i ndex 


15 




inet addr 


31 




i net a ton 


31 




i net 1 naof 


31 




i net npt of 


31 




i npt n t na 


31 




i npt n t on 


31 




i npt nt on 

1 1 1 C \j U l/UII 


31 




i n f nan 

1 1 1 1 1 1 U 1 1 


24 




i ni tarnun^ 

1 II 1 H 1 uuuo 


26 




init^tatp 

III 1 L* O U L- t 


24 




i oct 1 


33 




i c a 1 niim 

1 O U 1 1 1 L4 1 1 1 


23 




i c a l nha 

1 O U 1 p 1 1 u 


23 




i s a ri i 


23 




i s a 1 1 v 


33 




i sbl an k 


23 




i s cn t rl 


23 




i sdi gi t 


23 




i sa ranh 


23 




i s i nf 


24 




i s 1 owe r 


23 




i snan 


24 




i s p r i n t 


23 




i spunct 


23 




i s spa ce 


23 




i s unnp r 


23 




i swa 1 n urn 


23 




i swa 1 pha 


23 




i swhl a n k 

1 OWL/ 1 u 1 1 l\ 


23 




i swcntrl 


23 




iswdigit 


23 




iswgraph 


23 




i swl ower 


23 




i swpri nt 


23 




i swpunct 


23 
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i swspace 


23 


• 


1 swupper 


23 


• 


iswxdigit 


23 




isxdigit 


23 


• 


jO 


24 




jl 


24 


• 


jn 


24 




jrand48 


24 


• 


jrand48_r 


24 




kill 


6 




ki 1 1 pg 


6 




1 abs 


24 




1 chown 


21 




1 cong48 


24 


• 


1 cong48_r 


24 




1 dexp 


24 




1 di v 


24 


• 


lfind 


17 


• 


1 gamma 


24 


• 


link 


21 


• 


1 i o_l i sti o 


30 


• 


1 i sten 


32 




1 ocal econv 


27 


• 


1 ocal time 


25 


• 


1 ocal time_r 


25 


• 


log 


24 




log2 


24 


• 


loglO 


24 


• 


loglp 


24 


• 


longjmp 


7 


. . . 


1 rand48 


24 


• 


1 rand48_r 


24 




1 search 


17 




1 seek 


19 




1 stat 


21 




mal 1 oc 


13 
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ma 1 1 opt 


13 




mbl en 


23 




mb rl en 


23 




mb rt owe 

1 1 1 kj 1 l/UVVLi 


23 




mh^n rt nwr^ 

1 1 1 U O 1 1 1 tUWL J 


23 




mhc rt nwr^ 

1 1 1 L/ O I I U Vv t O 


23 




mh^ t nwr^ 

1 1 1 U O UUVYL o 


23 





mht owr 


23 




mrhpr k 


13 




1 1 1 C 1 II \* \* U J 


15 




mpmph r 

1 1 IC 1 II \* 1 1 1 


15 




iiiciii win u 


15 




mpmrn v 

1 1 1 c ii i y/j 


15 




memf roh 

1 1 IC 1 II 1 1 u u 


15 




mpmmpm 

1 1 IC 1 III 1 1 CI II 


15 




mpmmnvp 

1 1 1 C 1 III 1 1 \J V c 


15 




mpmncn v 

1 1 1 C 1 II L/ \-r VJ J 


15 




mems et 


15 




mkdi r 


20 




mkf i f o 


28 




mknod 


21 




mks temp 


20 




mktemp 


20 




mkt i me 


25 




ml ock 


14 




ml ocka 1 1 


14 




mmap 


14 




modf 


24 




mp robe 


13 




mn rot prt 

1 1 1 U 1 \J \j C \* L# 


14 




mrand48 


24 




mrand48_r 


24 




mremap 


14 




msgctl 


29 




msgget 


29 




msgrcv 


29 
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msgsnd 


29 


• 


msync 


14 


• 


mtrace 


13 


• 


muni ock 


14 


• 


muni ockal 1 


14 




munmap 


14 




muntrace 


13 




nanosl eep 


9 




next_key 


22 




nftw 


20 


• 


nice 


11 




nl_l anginfo 


27 




nrand48 


24 




nrand48_r 


24 


• 


ntohl 


31 




ntohs 


31 




on_exit 


5 




open 


19 




opendi r 


20 


• 


openl og 


26 


• 


pause 


7 


• 


pel ose 


4 


• 


personal ity 


30 


• 


perror 


5 


• 


pipe 


28 


• 


poll 


30 


• 


popen 


4 


• 


pow 


24 


• 


pread 


19 


• 


pri ntf 


10 




psel ect 


26 


• 


psi gnal 


6 




pthread_atfork 


12 




pthread_att rudest roy 


12 




pthread_attr_getdetachstate 


12 




pthread_attr_getguardsize 


12 
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pt h read attr getinheritsched 


12 




pt h read attr getshedparam 


12 




pthread attr getschedpolicy 


12 




pthread attr getscope 


12 




nthrpad attr apt^tarkadrir 

L/ U 1 1 1 Cliu U L- U 1 MC L J UU^ MIUUI 


12 




nthrpad attr apt^tark^i 7P 

L/UIII \^ U \J LI U U 1 MCIJ LULKJ 1 £- \Z 


12 




nthrpad attr init 

U 1 1 1 1 CL1 U LI U U 1 1 1 1 1 U 


12 




nthrpad attr ^ptdptarh^tatp 

L/UIII CLIU U L LI OC LUC l/UL)ll J UU UC 


12 




nthrpad attr ^ptanarri^i 7P 

L/UIII Cliu U 1 L 1 Ljj UU 1 U O 1 L- \Z 


12 





nthrpad attr ^ptinhpritsrhpd 

L/UIII CLIU U L L 1 J C L 1 UNCI 1 L JUIICU 


12 




nthrpad attr ^pt^rhprinaram 

L/UIII C LI U U L L 1 J C L J ^IICUUU 1 U 1 1 1 


12 




nthrpad attr ^pt^rhprinnl irv 

L/UIII C LI U LIUUI O C L JL'IICUL'U 1 I \* J 


12 




nthrpad attr ^pt^rnnp 

L/UIII C LI U uUUI LoLuUC 


12 




nthrpad attr ^pt^tarkadrir 

L/UIII CLIU LIUUI OCLOLUtMiUUI 


12 




nthrpad attr ^pt^tark^i 7P 

L/UIII CLIU LIUUI OCUOUUl*l\3 1 L- \Z 


12 




nthrpad ranrpl 

L/UIII CLIU L U II LC 1 


12 




pthread cleanup pop 


12 




pthread cleanup push 


12 




pthread cond broadcast 


12 




pthread cond des t roy 


12 




pthread cond init 


12 




pthread cond signal 


12 




pthread cond timedwait 


12 




pthread cond wait 


12 




pthread condattr destroy 


12 




pthread condattr init 


12 




pt h read create 


12 




pthread detach 


12 




pt h read ec| ua 1 


12 




nt hrpad pxit 

L/UIII CLIU C/\l U 


12 




pthreacLgetschedparam 


12 




pthreacLgetspeci f ic 


12 




pthread_join 


12 




pthread_key_create 


12 




pthread_key_del ete 


12 




pthread_ki 1 1 


12 
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pthread_mutex_destroy 


12 




pthread_mutex_init 


12 




pthread_mutex_l ock 


12 




pthread_mutex_tryl ock 


12 




pthread_mutex_unl ock 


12 




pthread_mutexattr„destroy 


12 




pthread_mutexattr_gettype 


12 




pthread_mutexattr_i nit 


12 




pthread_mutexattr_settype 


12 




pthread_once 


12 




pthread_sel f 


12 




pthread_setcancel state 


12 




pthread_setcancel type 


12 




pthread__setschedparatn 


12 




pthread_setspeci f ic 


12 




pthread_si gmask 


12 




pthread_testcancel 


12 




ptsname 


33 




ptsname_r 


33 


• 


putc 


10 


• 


putchar 


10 


• 


putenv 


3 




putpwent 


26 




puts 


10 


• 


pututl ine 


26 


• 


pututxl ine 


26 




putw 


18 


• 


putwc 


23 


• 


putwchar 


23 


• 


pwrite 


19 




qecvt 


23 


• 


qecvt_r 


23 




qfcvt 


23 




qfcvt_r 


23 




qsort 


17 




rai se 


6 
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rand 




24 




rand r 




24 




random 




24 




rawmemch r 




15 




rsad 




19 




rpa Hfii r 

i u \a "Jl i i 




20 




ppa d 1 ink 




21 




rsad v 




19 




ppa 1 1 or 




13 





rpa 1 na t h 

1 1 UU L 1 




20 




rp romn 




16 




rscv 




32 




pprvf mm 

1 V 1 1 VJ 1 1 1 




32 




rarwmc n 

1 C L* V lllo M 




32 




pp pYPP 




16 




i c y \* \j i ii L/ 




16 




reger ror 




16 




i t y /\ ^ w 




16 




regf ree 




16 




remove 




20 




re m a me 




20 




rewi nd 




18 




rewi nd d i r 




20 




rind sx 




15 




rint 




24 




rmdi r 




20 




sbrk 




13 




scandi r 




20 




scanf 




10 




sched_getparam 


1 1 




sched_get 


_priority_max 


11 




sched_get 


_priority_min 


11 




sched_getschedul er 


11 




sched_rr_ 


get_i nterval 


11 




sched_setparam 


11 




sched_setschedul er 


11 
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sched_yield 


11 


• 


seed48 


24 


• 


seed48_r 


24 


• 


seekdi r 


20 


• 


sel ect 


26 




sem_cl ose 


12 


• 


sem_destroy 


12 




semjetval ue 


12 


• 


sem_init 


12 




sem_open 


12 


• 


semjost 


12 




sem_trywai t 


12 




sem_wait 


12 




semctl 


29 




semget 


29 




semop 


29 




send 


32 


• 


sendmsg 


32 




sendto 


32 


• 


setbuf 


18 


• 


setbuffer 


18 




setdomainname 


26 


• 


setegid 


2 


• 


setenv 


3 




seteuid 


2 


• 


setf sent 


26 


• 


setgid 


2 


• 


setgrent 


26 


• 


setgroups 


2 




sethostent 


31 




sethostid 


26 


• 


sethostname 


26 




setitimer 


9 




setjmp 


7 




setkey 


16 




setkey_r 


16 
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s e 1 1 inebuf 


18 




set 1 oca 1 e 


27 




setmntent 


26 




setnetent 


31 




cpt nai d 


2 




c at na rn 


2 




sptnrioritv 

O C L- VJ 1 1 \J \ 1 Lr V 


1 1 





spt nrot opnt 


31 




cpt nwpn t 

O C L UWCI 1 U 


26 




cpt rpai d 


2 




cptppcnifi 

o C U 1 COM 1 ^ 


2 




cpt rpcij-j H 

O C 1 CO U 1 U 


2 




cpt ppl] i H 


2 




cpt rl imit 
o c 1. 1 i 1 1 1 1 1 \j 


g 




cpt c pnwpn t 

O C LOCI V CM U 


31 




c p t c -j H 


2 




set soc kopt 


32 




set state 


24 




setti meof day 


25 




s e t u i d 


2 




set use rs hel 1 


26 




set utent 


26 




set utxent 


26 




setvbuf 


18 




shmat 


29 




s hmc 1 1 


29 




shmdt 


29 




s hmget 


29 




shutdown 


32 




siaartion 

O 1 MQvU 1 wll 


7 




si gaddset 


7 




sigaltstack 


7 




sigandset 


7 




sigblock 


7 




sigdel set 


7 




sigemptyset 


7 
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si gf i 1 1 set 


7 


• 


si ggetmask 


7 


• 


si gi interrupt 


6 


• 


sigisemptyset 


7 


• 


sigismember 


7 




si gl ongjmp 


7 


• 


sigmask 


7 




si gnal 


6 




sigorset 


7 




sigpause 


7 




sigpending 


7 




si gprocmask 


7 




sigqueue 8 


si gsetjmp 


7 




si gsetmask 


7 




si gsuspend 


7 




sigtimedwait 8 


si gvec 


6 




sigwait 


12 




sigwaitinfo 8 


sin 


24 




sincos 


24 




si nh 


24 




si eep 


9 




snprintf 


10 




socket 


32 




socketpai r 


32 




sprintf 


10 




sqrt 


24 




srand 


24 




srand48 


24 




srand48_r 


24 




srandom 


24 




sscanf 


10 




stat 


21 




statf s 


26 
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s tder r 


10 




s t d i n 


10 




s tdout 


10 




st i me 


25 




store 


22 




c f nrnv 


15 




c t nnrnv 


15 




O l 1 V^U OCLIIIU 


15 




s t pea t r 


15 




cf rr a t 


15 




c f rr h r 

J l 1 *w 1 1 1 


15 




cf rrmn 

O l 1 II 1 u 


15 




c f rrnl 1 

O l 1 1 1 


15 




cfrrnv 

Oil Uj 


15 




c f rrenn 

O l 1 L. J L>l 1 


15 




cf rr] ijn 


15 




st rdupa 


15 




st per pop 


5 




stpeppop p 


5 




s t pf mon 


27 




st pf py 


16 




s t pf t i me 


25 




st p! en 


15 




s t pnea s ecmp 


15 




st pnea t 


15 




s t pnemp 


15 




st pnepy 


15 




s t pn 1 en 


15 




st pndup 


15 




c t rndunrt 


15 




strpbrk 


15 




strptime 


25 




strrchr 


15 




strsep 


15 




strsignal 


6 




strspn 


15 
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strstr 


15 


• 


strtod 


23 


• 


strtof 


23 




strtok 


15 


• 


strtok_r 


15 




strtol 


23 




strtold 


23 




strtol 1 


23 




strtoul 


23 




strtoul 1 


23 




strxf rm 


15 




swprintf 


23 




swscanf 


23 




syml ink 


21 




sync 


18 




sysinfo 


26 




sysl og 


26 


• 


system 


4 




tan 


24 


• 


tanh 


24 


• 


tcdrai n 


33 


• 


tcf 1 ow 


33 


• 


tcfl ush 


33 


• 


tcgetattr 


33 


• 


tcgetpgrp 


33 


• 


tcsendbreak 


33 


• 


tcsetattr 


33 


• 


tcsetpgrp 


33 


• 


tdel ete 


17 


• 


tdestroy 


17 




telldir 


20 


• 


tempnam 


20 




textdomai n 


27 




tfind 


17 




tgamma 


27 




time 


25 
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t i me r add 


9 • 




ti mercl ear 


9 




t i men" s set 


9 • 




t i mprsub 

i — i 1 1 1 \ — i o li yj 


9 




t i taps 

Is 1 1 II c o 


9 




tmnf 1 1 p 

\j 1 1 1 U 1 1 1 \Z 


20 




tmnnam 

U 1 1 1 L/ 1 1 U III 


20 • 





tmnnam r 

L- 1 1 1 U 1 1 U 1 II 1 


20 




t na s ri i 

l- yj u o ^ i i 


23 • 




t ol owp r 

LU 1 U TI C 1 


23 




t nunne r 

l/W U U L/C 1 


23 • 




fowl owpp 


23 




t owunnpr 


23 • 




t rune 


24 




t runra t p 

U 1 U 1 1 L- U 


21 




t spa rrh 

L> JCU 1 Oil 


17 




ttyname 


33 




ttyname r 


33 • 




twal k 


17 




tzset 


25 • 




uma s k 


21 




un ame 


26 




uncjet c 


10 




ungetwc 


23 • 




un 1 i n k 


20 




un 1 oc kpt 


33 • 




un seten v 


3 




undwtmn 


26 • 




us 1 eep 


9 • 




u s t a t 

L4 O U LI L> 


26 




uti me 


21 




utimes 


21 




utmpname 


26 




vf scanf 


10 




vfprintf 


10 




vfwprintf 


23 
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vfwscanf 


23 


• 


vprintf 


10 


• 


vscanf 


10 




vsnpri ntf 


10 


• 


vsprintf 


10 




vsscanf 


10 




vswpri ntf 


23 




vswscanf 


23 




vwprintf 


23 




vwscanf 


23 




wait 


5 




wait3 


5 




wait4 


5 




waitpid 


5 




wcrtomb 


23 




wcscasecmp 


23 




wcscat 


23 


• 


wcschr 


23 




wcscmp 


23 


• 


wcscol 1 


23 


• 


wcscpy 


23 


• 


wcscspn 


23 




wcsl en 


23 


• 


wcsncasecmp 


23 


• 


wcsncat 


23 


• 


wcsncmp 


23 




wcsncpy 


23 


• 


wcsnl en 


23 


• 


wcsnrtombs 


23 


• 


wcspbrk 


23 




wcsrchr 


23 


• 


wcsrtombs 


23 




wcsspn 


23 




wcsstr 


23 




wcstod 


23 




wcstof 


23 





Fonctions et appels-systeme etudies 

Annexe 2 



Norn 


Chapitre 


Fonction Ap f el " lsoC9X SUSv3 Gnu Obsolete 
sysleme 


wcs to k 
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Documents informatiques 

Voici quelques sujets de documentation accessible avec la commande info lorsque le paque- 
tage correspondant est installe. Nous avons selectionne des themes particulierement utiles 
pour le developpeur : 

• Standards : normes de codage pour les logiciels Gnu ; 

• Gcc : documentation du compilateur C Gnu ; 
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• Li be : documentation de la bibliotheque GlibC ; 

• Cpp : documentation du preprocesseur C Gnu ; 

• As : l'assembleur Gnu ; 

• Ld : documentation de l'editeur de liens Gnu ; 

• Bi nuti 1 s : ensemble d'outils permettant la manipulation des fichiers executables et objet ; 

• Gdb : documentation du debogueur Gnu ; 

• Gprof : documentation du profileur Gnu ; 

• Make : documentation du constructeur d' application Gnu ; 

• Automake : documentation de l'outil de creation des fichiers Makefile ; 

• Autoconf : systeme d'elaboration des scripts de configuration pour les sources d'un logiciel ; 

• Grep : documentation de l'outil de recherche grep 

• Indent : documentation de l'outil de mise en forme Gnu ; 

• Readl i ne : documentation de la bibliotheque Gnu Readline. 

Les documents HOW-TO Linux couvrent un grand nombre de sujets et sont pour la plupart 
disponibles en version francaise. On les trouve en version originale sur le site du Linux Docu- 
mentation Project : http://www.tldp.org/et en version francaise sur http://www.traduc.org/ 

• Adv-Routing-HOWTO : routage avance et gestion du trafic reseau ; 

• Bridge+Firewall+DSL-mini-HOWTO : configuration d'une passerelle reseau avec firewall 
pour une liaison type ADSL ; 

• C++-dlopen-mini-HOWTO : chargement dynamique de fonctions en C++ ; 

• Config-HOWTO : trues et astuces pour personnaliser une station Linux ; 

• Ethernet-HOWTO : configuration des cartes reseaux ; 

• Francophones-HOWTO : configuration d'un systeme Linux francophone ; 

• From-PowerUp-To-Bash-Prompt-HOWTO : ce qu'il se passe depuis la mise sous tension 
jusqu'a la connexion utilisateur ; 

• Glibc-Install-HOWTO : installation et configuration de gec sur une machine Linux ; 

• Glibc2-HOWTO : installation et configuration de la GlibC 2 ; 

• Hardware-HOWTO : liste du materiel fonctionnant - ou ne fonctionnant pas - sous Linux ; 

• Home-Network-mini-HOWTO : comment configurer une station Linux comme passerelle 
Internet pour un reseau personnel (ou de petite entreprise) ; 

• IO-Port-Programming-mini-HOWTO : acces aux ports d' entrees-sorties physiques ; 

• Kernel-HOWTO : configuration et compilation du noyau ; 

• KernelAnalysis-HOWTO : fonctionnement interne du noyau ; 

• NET3-4-HOWTO : configuration d'un reseau avec Linux ; 

• Parallel-Processing-HOWTO : introduction a la programmation parallele sous Linux ; 

• RPM-HOWTO : utilisation de l'outil de paquetage rpm ; 

• SCSI-Programming-HOWTO : programmation de drivers utilisant l'interface SCSI gene- 
rique ; 
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• Security-HOWTO : considerations diverses a propos de la securite d'un systeme Linux ; 

• Serial-HOWTO : configuration des lignes serie ; 

• Serial-Programming-HOWTO : acces logiciel aux ports serie de la machine ; 

• Software-Building-HOWTO : informations sur les meilleures methodes de distribution de 
logiciels fibres ; 

• Software-Release-Practice-HOWTO : informations sur les dispositions legales pour la distri- 
bution de logiciels libres. 
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encrypt_r() 43 1 
endfsent() 

definition 69 1 
endgrent() 

definition 68 1 
endhostent() 

definition 836 
endmntent() 

definition 692 
endnetent() 

definition 837 
endorder 453 
endprotoent() 

definition 819 
endpwent() 

definition 683 
endserventQ 

definition 826 
endusershell() 

definition 684 
endutent() 

definition 699 
endutxent() 

definition 702 
ENFILE 81, 116, 117 
enm VISIT 453 
ENODEV 116, 374 
ENOENT 81, 116, 119, 761 
ENOEXEC 81, 116 
ENOLCK 116 

ENOMEM30, 81, 116, 117, 374, 
761 

ENOSPC 116, 508, 543,761 
ENOSYS 116, 757 
ENOTBLK 116 
ENOTDIR 81, 116 
ENOTEMPTY 1 16, 543, 549 
ENOTTY 116 
ENTER 459 
ENTRY 459, 461 
environ 53, 54, 76, 77, 78 

definition 52 
environnement 51, 76, 80, 81, 559 
ENXIO 116, 750 

EOF 241, 242, 244, 245, 247, 249, 
252, 253,469, 477, 750, 881 



EOL 881 
EOL2 881 
EOPNOTSUPP 428 
EPERM81, 116, 137,310, 543 
EPIPE 116, 130, 508, 746 
EPROTONOSUPPORT 841 
erand48() 

definition 656 
erand48_r) 

definition 658 
ERANGE 116, 117 
ERASE 881 
erf() 

definition 643 
erfc() 

definition 643 
erfcfO 

definition 643 
erfcl() 

definition 643 
erff() 

definition 643 
erfl() 

definition 643 
EROFS 116 
erreur 1 14 

fonction d'~ 643 
errno 30,81, 115, 130, 168, 231 

definition 114 
ESPIPE 116 
ESRCH 116, 137 
Ethernet 814 
ETIMEDOUT 318 
ETXTBSY 82, 116, 373, 374 
EWOULDBLOCK 116, 529 
EXDEV 116, 549 
exec() 43, 46, 75, 84, 86, 158, 217, 
279, 307, 308, 374, 516 
execl() 75, 87 

definition 80 
execle() 75 

definition 80 
execlpO 75 

definition 79 
execv() 75 

definition 78 
execve() 75 

definition 76 
execvp() 75, 561 

definition 78 
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exit() 44, 81, 95-97, 100, 101, 126, 
129, 168, 266, 490 

definition 95 
EXIT_FAILURE 94 
EXIT_SUCCESS 94, 96 
exp() 

definition 639 
explOO 

definition 640 
expl0f() 

definition 640 
explOK) 

definition 640 
exp2() 

definition 639 
exp2f() 

definition 639 
exp21() 

definition 639 
expf() 

definition 639 
expl() 

definition 639 
expml() 

definition 639 
expmlf() 

definition 639 
expmll() 

definition 639 
exponentielle 639 

F 

F_DUPFD516 
F_GETFD 517 
F_GETFL518, 519, 785 
F_GETLK 520, 522 
F_GETOWN519, 797 
F_GETSIG519, 797 
F_OK 572 
F_RDLCK 520 
F_SETFD517 
F_SETFL518, 519, 784 
F_SETLK520, 521,522 
F_SETLKW 520, 521 
F_SETOWN519, 797 
F_SETSIG519, 797 
F_UNLCK 520, 522 
F_WRLCK 520 
fabs() 

definition 648 



fabsf() 

definition 648 
fabsl() 

definition 648 
fchdir() 538 

definition 536 
fchmodO 571 

definition 571 
fchown() 573 

definition 573 
fclose() 86, 469, 470, 488, 496 

definition 469 
fcloseall() 469 

definition 469 
fcntl() 302, 374, 494, 516, 517, 
520-522, 529, 784, 785, 796, 797 

definition 516 
fcvt() 623, 625 

definition 622 
fcvt_r() 

definition 624 
FD_CLOEXEC517 
FD_CLR() 

definition 790 
FD_ISSET() 

definition 790 
fd_set 790 
FD_SET() 

definition 790 
FD_SETSIZE 790 
FD_ZERO() 

definition 790 
fdatasync() 808 

definition 808 
fdopen() 472, 499, 552, 750 

definition 47 1 
feof() 

definition 490 
ferror() 491 

definition 490 
fetch() 595 

definition 594 
FF0 879 
FF1 879 
FFDLY 879 

fflush() 470-472, 478, 485, 807, 
876, 877 

definition 469 
fgetc() 244, 245, 247, 473, 480 

definition 244 



fgetgrent() 

definition 681 
fgetgrent_r() 

definition 681 
fgetpos() 477, 484 

definition 484 
fgetpwent() 

definition 683 
fgetpwent_r() 

definition 683 
fgets() 252, 259, 261, 473, 490 

definition 25 1 
fgetwc() 

definition 628 
fgetws() 

definition 628 
fichier 

acces a un ~ 47 

attributs d'un ~ 47, 567 

temporaire 549 

verrouillage d'un - 374 
fifo 

Voir tube nomme 
FILE 227, 465, 467 
fileno() 

definition 491 
nitre 228 
FIND 459 
find 17 
finite() 

definition 65 1 
first_key() 

definition 596 
firstkeyO 596 
flex 264, 414, 417 
flock() 520, 529 

definition 529 
floor() 647 

definition 647 
floorfO 

definition 647 
floorl() 

definition 647 
FLUSHO 880 
flux 

definition 227 

fermeture d'un - 96, 469 

ouverture d'un ~ 466, 471 

positionnement dans un ~ 477 

standard 227 
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fmod() 

definition 649 
fmodf() 

definition 649 
fmodl() 

definition 649 
FNM_CASEFOLD 553 
FNM_FILE_NAME 553 
FNM_LEADING_DIR 553 
FNM_NOES CAPE 553 
FNM_NOMATCH 553 
FNM_PATHNAME 553 
FNM_PERIOD 553 
fnmatch() 553 

definition 553 
fopen() 227, 230, 467, 468, 471, 

472, 491,499, 551,750 
definition 467 

fork() 29, 43, 44, 46, 51, 84, 86, 
119-121, 158, 219, 279, 286, 291, 
307, 308, 374, 379, 473, 518, 740, 
868 

definition 29 
format 

pour printf() 230 

pour scanf() 255 
fpos_t 484 

fprintf() 86, 87, 168, 230, 238, 243, 

473, 474, 475 
definition 230 

fputc() 241, 242, 244, 473, 480 

definition 241 
fputs() 473 

definition 243 
fputwc() 

definition 628 
fputws() 

definition 628 
FRAC_DIGITS 733 
fread() 86, 139, 474, 475, 477, 490 

definition 474 
free() 167, 342, 343, 35 1, 352, 357, 
359 

definition 342 
freopen() 472, 473,514 

definition 472 
frexpQ 

definition 650 
frexpf() 

definition 650 



frexplO 

definition 650 
fscanf() 86, 264, 473, 474, 475 

definition 255 
fseek() 477, 478, 491,511 

definition 478 
fseeko() 477, 478, 480 

definition 480 
fsetpos() 477, 478, 484, 491 

definition 484 
fstat() 569 

definition 567 
fstatfs() 696 

definition 695 
fsync() 302, 807, 808 

definition 507 
ftell() 477, 478, 479 

definition 478 
ftello() 477, 480 

definition 480 
ftime() 

definition 663 
ftok() 758 

definition 758 
ftruncateO 576 

definition 575 
ftwO 567 

definition 563 
FTW_CHDIR 564 
FTW_D 564 
FTW_DEPTH 564 
FTW_DNR 564 
FTW_DP 564 
FTW_F 564 
FTW_MOUNT 564 
FTW_NS 564 
FTW_PHYS 564 
FTW_SL 564 
FTW_SLN 564 
fungetcO 473 
fwprintf() 

definition 629 
fwrite() 86, 474, 475, 477 

definition 473 
fwscanf() 

definition 629 

G 

gamma 

fonction ~ 644 
gcc 7, 97, 99 



gcvt() 623, 625 

definition 622 
gdb9, 131,266, 268,385 
GDBM 587, 589, 590, 597-604 
gdbm_close() 

definition 602 
gdbm_delete() 

definition 602 
gdbm_errno 601 
gdbm_error 602 
gdbm_exist() 

definition 602 
gdbm_fdesc() 

definition 602 
gdbm_fetch() 

definition 602 
GDBM_FILE 600, 601 
gdbm_firstkey() 

definition 602 
GDBMJNSERT 602 
GDBM_NEWDB 601 
gdbm_nextkey() 

definition 602 
GDBM_NOLOCK 601 
gdbm_open() 601 

definition 601 
GDBM_READER 601 
gdbm_reorganize() 

definition 602 
GDBM_REPLACE 602 
gdbm_setopt() 

definition 602 
gdbm_store() 602 

definition 602 
GDBM_SYNC 601 
gdbm_sync() 

definition 602 
GDBM_WRCREAT 601 
GDBM_WRITER 601 
gdm_strerror() 603 
get_current_working_dir_name() 
537 

definition 537 
GETALL 776 
getc() 245 

definition 245 
getchar() 

definition 245 
getcwd() 537, 538 

definition 537 
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getdate() 670, 673, 675, 725 

definition 672 
getdate_err 672, 673 
getdate_r() 672, 673 

definition 672 
getdomainname() 

definition 686 
getegid() 

definition 37 
getenv() 54, 56 

definition 53 
geteuid() 33 

definition 32 
getfsent() 

definition 692 
getfsfile() 

definition 692 
getfsspec() 

definition 692 
getgid() 

definition 37 
getgrent() 

definition 681 
getgrent_r() 

definition 681 
getgrgid() 680 

definition 680 
getgrgid_r() 680 

definition 680 
getgrnam() 680, 693 

definition 680 
getgrnam_r() 680 

definition 680 
getgroups() 38, 39 

definition 38 
gethostbyaddr() 

definition 834 
gethostbyaddr_r() 

definition 834 
gethostbyname() 

definition 834 
gethostbyname_r() 

definition 834 
gethostbyname2() 

definition 834 
gethostbyname2_r() 

definition 834 
gethostent() 

definition 836 
gethostid() 

definition 686 



gethostname() 685 

definition 685 
getitimer() 199 

definition 200 
getline() 253, 254, 261 

definition 253 
getlogin() 87, 90 

definition 684 
getlogin_r() 

definition 684 
getmntent() 696 

definition 693 
getmntent_r() 

definition 693 
GETNCNT 776 
getnetbyaddr() 

definition 837 
getnetbyname() 

definition 837 
getnetent() 

definition 837 
getopt() 60, 62, 64, 65, 66 

definition 62 
getopt_long() 65, 66, 67, 69 

definition 65 
getopt_long_only() 65 

definition 67 
getpass() 

definition 887 
getpeername() 

definition 845 
getpgid() 41 

definition 41 
getpgrp() 138 

definition 42 
GETPID 776 
getpid() 29, 138 

definition 29 
getppid() 

definition 29 
getpriority() 275 

definition 273 
getprotobyname() 

definition 818 
getprotobyname_r() 

definition 820 
getprotobynumber() 

definition 818 
getprotobynumber_r() 

definition 820 



getprotoent() 

definition 819 
getprotoent_r() 

definition 820 
getpt() 

definition 890 
getpwent() 

definition 683 
getpwent_r() 

definition 683 
getpwnam() 

definition 683 
getpwnam_r() 

definition 683 
getpwnameQ 559 
getpwuid() 

definition 683 
getpwuid_r() 

definition 683 
getresgid() 

definition 40 
getrlimit() 133, 221, 345 

definition 217 
getrusage() 215 

definition 215 
gets()249, 251 

definition 249 
getservbyname() 842 

definition 825 
getservbyname_r 

definition 827 
getservbyport() 842 

definition 825 
getservbyport_r 

definition 827 
getservent() 

definition 826 
getservent_r 

definition 827 
getsid() 

definition 44 
getsockname() 

definition 844 
getsockopt() 

definition 863 
getsubopt() 68, 69, 694 

definition 67 
gettext() 

definition 718 
gettimeofday() 318, 662, 663 

definition 661 
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getuid() 33 

definition 32 
getusershell() 

definition 684 
getutent() 

definition 699 
getutent_r() 

definition 699 
getutid() 

definition 699 
getutid_r() 

definition 699 
getutline() 

definition 699 
getutline_r() 

definition 699 
getutxent() 

definition 702 
getutxid() 

definition 702 
getutxline() 

definition 702 
GETVAL 776 
getw() 477 

definition 477 
getwc() 

definition 628 
getwchar() 

definition 628 
getwd() 537 

definition 537 
GETZCNT 776 
GID37, 81 

effectif 37, 40 

reel 37, 81 

sauve 40 
gid_t 37 

glob() 555, 556, 557, 558 

definition 555 
GLOB_ AB ORTED 557 
GLOB_ALTDIRFUNC 556 
GLOB_APPEND 556 
GLOB_BRACE 556 
GLOB_DOOFS 556 
GLOB_ERR 556, 557 
GLOB_MARK 556 
GLOB_NOCHECK 557 
GLOB_NOESCAPE 557 
GLOB_NOMAGIC 557 
GLOB_NOMATCH 557 
GLOB_NOSORT 557 



GLOB_NOSPACE 557 
GLOB_PERIOD 557 
glob_t 555, 557 
GLOB_TILDE 557 
GLOB_TILDE_CHECK 557 
globfree() 557, 558 

definition 555 
gmtime() 

definition 665 
gmtime_r() 

definition 665 
Gnome 6, 24 
Gnu 

application 64 

extension 231, 253 
goto 126, 305, 306 
GPG431,435 
gprof 13 
grantpt() 

definition 891 
grep 17, 94 
groupe 

d'utilisateurs 37,41,679 

de processus 37, 41, 44, 45, 887 

multicast 865 

supplementaire 38, 39, 40, 47 
GTK 25 
gzip 20 

H 

h_errno 837 
hasmntopt() 

definition 694 
hcreate() 

definition 458 
hcreate_r() 

definition 458 
hdestroyO 

definition 459 
hdestroy_r() 

definition 458 
herror() 

definition 838 
Hoare C. 446 

HOME 58, 59, 60, 467, 536, 559 
HOST_NOT_FOUND 837 
hostent 

definition 834 
hsearch() 459 

definition 459 



hsearch_r() 459 

definition 458 
hstrerror() 

definition 838 
htonl() 

definition 822 
htonsQ 

definition 822 
HUGE_VAL 652 
HUPCL 880 
hypot() 

definition 637 
hypotf() 

definition 637 
hypotl() 

definition 637 
HZ 197, 199 

I 

ICANON 880 

ICMP 816, 863 

ICRNL 878 

IEEE 754 650, 653 

IEEE 854 653 

IEXTEN 880 

IFS 60, 86 

IGNBRK 878 

IGNCR 878 

IGNPAR 878 

imake 19 

IMAXBEL 878 

INADDR_ANY 843, 850 

INADDR_BROADCAST 829 

INADDR_NONE 828, 829 

indent 15 

index() 

definition 411 
inet_addr() 

definition 828 
inet_aton() 

definition 828 
inet_lnaof() 

definition 830 
inet_netof() 831 

definition 830 
inet_ntoa() 

definition 828 
inet_ntop() 

definition 832 
inet_pton() 

definition 832 
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inetd516, 867 
infinis 65 1 
info 1 1 

ink 29, 30, 58, 96, 105, 130, 137, 
266 

INIT_PROCESS 698 
initgroups() 

definition 682 
initstate() 

definition 656 
INLCR 878 
INPCK 878 

INT_CUR_SYMBOL 733 
INT_FRAC_DIGITS 733 
INT_MAX 232 
internationalisation 625, 709 
INTR 881 
iocfl() 874 
IP 814, 815 

ng815 

v4 828 

v6 828, 832 
IP_ ADD_MEMB ERS HIP 865, 
867 

IP_DROP_MEMBERSHIP 867 
IP_MULTICAST_IF 867 
IP_MULTICAST_LOOP 867 
IP_MULTICAST_TTL 867 
IPC Systeme V 757 
IPC_CREAT 760, 770 
IPC_EXCL 760, 770 
IPC_NOWAIT 762, 763, 774 
IPC_PRIVATE 758, 760 
IPC_RMID764, 771,776 
IPC_SET 764, 771,776 
IPC_STAT764, 771, 776 
IPPROTOJCMP 840 
IPPROTOJP 863, 867 
IPPROTO_RAW 840 
IPPROTO_TCP 863, 867 
isalnum() 

definition 615 
isalpha() 

definition 615 
isascii() 

definition 615 
isatty() 

definition 885 
isblank() 

definition 615 



iscntrl() 

definition 615 
isdigit() 

definition 615 
isgraph() 

definition 615 
ISIG 880 
isinf() 

definition 65 1 
islowerQ 

definition 615 
isnan() 

definition 650 
ISO 8859-1 625, 907 
ISO 8859-15 625, 907 
ISO_9660 543 
ISO-4217 727 
ISO-8859-1 403 
isprint() 

definition 615 
ispunct() 

definition 615 
isspace() 260 

definition 615 
ISTRIP 878 
isupper() 

definition 615 
iswalnum() 

definition 627 
iswalpha() 

definition 627 
iswblank() 

definition 627 
iswcntrl() 

definition 627 
iswdigit() 

definition 628 
iswgraphQ 

definition 628 
iswlower() 

definition 628 
iswprint() 

definition 628 
iswpunct() 

definition 628 
iswspace() 

definition 628 
iswupperQ 

definition 628 
iswxdigit() 

definition 628 



isxdigit() 

definition 615 
ITIMER_PROF 199, 200, 204 
ITIMER_REAL 199-201, 204 
ITIMER_VIRTUAL 199, 200, 204 
IUCLC 878 
IXOFF 879 
IXON 879 



j0() 

definition 644 

jofo 

definition 644 

joio 

definition 644 

jK) 

definition 644 

jlf() 

definition 644 

jll() 

definition 644 
jiffies 213 
jn() 

definition 644 
jnf() 

definition 644 
jnl() 

definition 644 
jrand48() 

definition 657 
jrand48_r() 

definition 658 

K 

Kde 6, 24 
KDevelop 21 
Kernighan 

Brian W. 15,230, 395 
key_t 758, 770 
kflushd 808 
KILL 881 

kill() 137, 138, 139, 179, 181, 184 

definition 136 
killpgO 138 

definition 138 



L_ctermid 886 
L cuserid 684 
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L_INCR 478 
L_SET 478 
L_tmpnam 549 
L_XTND 478 
labs() 648 

definition 648 
LANG 403, 711,713 
LC_ALL 403, 711, 713 
LC_COLLATE711 
LC_CTYPE711 
LC_MESSAGES 711 
LC_MONETARY 711 
LC_NUMERIC 711 
lchown() 573 

definition 573 
lclint 14, 238 
lcong48() 

definition 657 
lcong48_r() 

definition 658 
Id 7, 251 
ldexp() 

definition 650 
ldexpf() 

definition 650 
ldexpl() 

definition 650 
ldiv() 

definition 649 
ldiv_t 649 
leader 43 

leaf 453, 454, 456 

lesstif 24 

lex 

Voir flex 
lfind() 440-442, 444 

definition 440 
IgammaQ 

definition 644 
lgammaf() 

definition 644 
lgammal() 

definition 644 
lien 

physique 577 

symbolique 579 
limites 

d'un processus 217 
link() 577, 582 

definition 577 



LinuxThreads 

bibliotheque 29 1 
lioJistio() 804 

definition 804 
LIO_NOP 804 
LIO_NOWAIT 804 
LIO_READ 804 
LIO_WAIT 804 
LIO_WRITE 804 
listen() 847 

definition 847 
little endian 820 
llabs() 648 

definition 648 
lldiv() 

definition 649 
lldiv_t 649 
LNEXT 881 
localeconv() 732 

definition 729 
localisation 60, 119, 122, 135, 237, 
403, 405, 412, 616, 621, 667, 670, 
709 

localtimeO 676 

definition 665 
localtime_r() 

definition 665 
LOCK_EX 529 
LOCK_NB 529 
LOCK_SH 529 
lockf() 302 
log() 

definition 640 
LOG_ ALERT 705 
LOG_AUTH 705 
LOG_AUTHPRIV 705 
LOG_CONS 704 
LOG_CRIT 705 
LOG_CRON 705 
LOG_DAEMON 704 
LOG_DEBUG 705 
LOG_EMERG 705 
LOG_ERR 705 
LOG_FTP 705 
LOGJNFO 705 
LOG_KERN 704 
LOG_LOCAL0 705 
LOG_LPR 705 
LOG_MAIL 704 
LOG_NDELAY 704 
LOG_NEWS 705 



LOG_NOTICE 705 
LOG_PERROR 704 
LOG_PID 704 
LOG_SYSLOG 705 
LOG_USER 704 
LOGJJUCP 705 
LOG_WARNING 705 
loglOO 

definition 641 
loglpO 

definition 640 
loglpfO 

definition 640 
loglpl() 

definition 640 
log2p() 

definition 641 
log2pf() 

definition 641 
log2pl() 

definition 641 
logarithme 640 
logf() 

definition 640 
LOGIN_PROCESS 698 
logl() 

definition 640 
LOGNAME 59, 60 
LONG_MAX 213 
longjmp() 127, 129, 170, 172 
lrand48() 658 

definition 656 
lrand48_r() 

definition 658 
Is 85, 86 

lsearch()441,442 

definition 440 
lseek()511,513 

definition 511 
lstat() 557, 569, 573 

definition 567 

M 

M_MAP_THRESHOLD 350 
M_MMAP_MAX351 
M_MMAP_THRESHOLD 351 
M_PI 634 
M_TOP_PAD351 
M_TRIM_THRESHOLD 351 
MAC 814 
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main() 53, 60, 62, 81, 93, 95-97, 
100, 266, 488 
make 18 
Makefile 18 

malloc() 60, 167, 332, 334, 336, 
337, 339, 341-344, 346, 351, 352, 
354, 355, 359, 373 

definition 332 
MALLOC_CHECK_ 357, 358 
MALLOC_MMAP_MAX_ 351 
MALLOC_MMAP_ 
THRESHOLD_ 35 1 
MALLOC_TOP_PAD_ 351 
MALLOC_TRACE 352, 354, 363 
MALLOC_TRIM_ 
THRESHOLD_ 35 1 
mallopt() 

definition 351 
mand 528, 694 
MAP_ANON 373 
MAP_ANONYMOUS 373 
MAP_DENYWRITE 373, 374 
MAP_FIXED 373, 374 
MAP_GROWSDOWN 373 
MAP_PRIVATE 372-374 
MAP_SHARED 372-374, 770 
masque 

umask 585 
MAX_CANON 875 
MAX_MAP_COUNT 374 
MAXPATHLEN 540 
MB_CUR_MAX 630, 631 
MB_LEN_MAX 630 
mblen() 

definition 63 1 
mbrlen() 

definition 63 1 
mbrtowc() 631 

definition 63 1 
mbsnrtowcs() 

definition 632 
mbsrtowcs() 

definition 63 1 
mbstate_t 630 
mbstowcs() 

definition 63 1 
mbtowcQ 

definition 630 
mcheck() 354, 355 

definition 354 



MCL_CURRENT 369 
MCL_FUTURE 369, 370, 374 
MD5 428, 429, 430 
memccpy() 391 

definition 391 
memchrO 396, 409, 410, 41 1 

definition 409 
memcmpO 394 

definition 393 
memcpyO 391, 392, 393 

definition 390 
memfrob() 

definition 427 
memmem() 410, 411 

definition 410 
memmove() 393 

definition 392 
memoire 

insuffisante 117 

partagee 47, 770, 778 

protection de la ~ 382 

verrouillee 47, 367 

virtuelle 82, 333, 379 
mempcpyO 

definition 391 
memsetO 340, 390 

definition 390 
messages 

file de - 760 
mkdir() 543, 582 

definition 543 
mkfifoO 

definition 749 
mknod() 584, 585, 749 

definition 582 
mkstempO 

definition 551 
mktempO 550, 551,552 

definition 549 
mktimeO 676 

definition 666 
mlock() 47,218,369-371 

definition 368 
mlockall() 369-371, 374 

definition 368 
mmap() 336, 337, 339, 351, 373- 
375, 379, 382, 770 

definition 371 
mode_t 495 
modf() 

definition 649 



modff() 

definition 649 
modfl() 

definition 649 
MON_l...MON_12 733 
MON_DECIMAL_POINT 733 
MON_THOUSANDS_SEP 733 
Motif 24, 168 
mount() 

definition 697 
mprobe() 355 

definition 355 
mprotectO 382, 383 

definition 382 
mrand48() 658 

definition 657 
mrand48_r() 

definition 658 
mremapO 

definition 381 
MREMAP_MAYMOVE 382 
MS_ASYNC381 
MSJNVALIDATE381 
MS_SYNC 381 
MSG_DONTROUTE 858 
MSG_EXCEPT 763 
MS G_NOERROR 763 
MSG_OOB 858 
MSG_PEEK 858 
msgctlO 759 

definition 764 
msgget() 759-761 
MSGMAX 760, 763 
MSGMNB 764 
MSGMNI 760 
msgrcv() 139, 763 

definition 763 
msgsnd() 139, 759, 763 

definition 762 
msqid_ds 759 
msync() 302 

definition 381 
mtraceO 352, 354, 363, 366 

definition 352 
multicast 47, 830, 865 
multitache 269 

preemptif 269 
munlock() 368, 369, 371 

definition 368 
munlockall() 368, 371 

definition 368 
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munmapO 375 

definition 375 
muntrace() 354 
mutex 308 
mutex_attr_t 311 

N 

N_CS_PRECEDES 733 
N_SEP_BY_SPACE 733 
N_SIGN_POSN 733 
NAME_MAX 534 
NaN650, 651, 653 
nanosleep() 197-199, 302 

definition 197 
NDBM 587, 589, 598-600 
NDEBUG 9, 98, 99, 223, 344 
Nedit 6 

NEGATIVE_SIGN 733 
NETDB_SUCCES 837 
NEW_TIME 698 
next_key() 

definition 596 
nextkey() 596 
NFS 134 
nftw() 563, 564 

definition 563 
NGROUPS 39 
NIC 830 
nice() 275 

definition 27 1 
NIS 600, 824 
NL_CAT_LOCALE 715 
nl_catd715 
nl_item 732 
nl_langinfo() 732 

definition 732 
NL0 879 
NL1 879 
NLDLY 879 
NLSPATH 715 
nm 14 
nmap 381 
NNTP 823 
NO_ADRESS 837 
NO_RECOVERY 837 
NOCLDSTOP 159 
NODEFER 159 
NOEXPR 733 
NOFLSH 880 
NPTL 

bibliotheque 291 



NR_OPEN 223 
nrand48() 

definition 656 
nrand48_r() 

definition 658 
NSIG 124, 137 
ntohl() 

definition 822 
ntohs() 

definition 822 
NTP 664 

O 

0_ACCMODE518 

0_APPEND 494, 495, 505, 506, 

519, 785 

O.ASYNC 797 

O.CREAT 494-496, 498, 598 

O.DIRECTORY 538 

O.DSYNC 808 

0_EXCL 494, 495, 498, 499, 551 
O.NDELAY 495 
O.NOCTTY 494 
O.NONBLOCK 494, 495, 519, 
750, 783-785 

O.RDONLY 494, 518, 598 
0_RDWR494, 518, 598 
O.RSYNC 808 
0_SYNC 495, 785, 808 
O.TRUNC 494, 495 
0_WRONLY494, 518 
objdump 14 
OCRNL 879 
OFDEL 879 
off_t511 
OFILL 879 
OLCUC 879 
OLD_TIME 698 
on_exit() 96, 100, 102 

definition 102 
ONLCR 879 
ONLRET 879 
ONOCR 879 
Open Group VI 
open() 117, 303, 493-496, 499, 
515,518, 538, 573,582, 750 

definition 493 
OPEN_MAX 469, 493 
opendir() 532, 538, 557 

definition 532 



openlogO 

definition 704 
optarg 62, 64, 66, 68 

definition 62 
opterr 62 

definition 62 
optind 62 

definition 62 
optopt 62 

definition 62 
ordonnancement 27, 47, 200, 207, 
265 

des threads 299 
FIFO 276 
OTHER 277 
priorite d'~ 46, 269 
RR277 

temps-reel 48, 275 
OSI 814 

P 

P_CS_PRECEDES 733 
P_SEP_BY_SPACE 733 
P_SIGN_POSN 733 
P_tmpdir 550 
PAGER 87 
PARENB 880, 900 
PARMRK 878 
PARODD 880, 900 
patch 18 

PATH 59, 60, 76, 78-81, 85-87 
PATH_MAX 537 
pause() 139, 165, 166, 303 

definition 165 
pclose() 84, 86, 504 

definition 86 
PENDIN 880 
perror() 119,490 

definition 119 
personalityO 

definition 793 
PGID 81, 137 
PGP 431, 435 
phtread_attr_t 297 
phtread_mutexattr_t 309 
PID 29, 81 
pid_t 29 

pipe() 493,515,842 

definition 738 
PIPE_BUF 747, 748, 750, 751 
PM_STR 733 
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poll() 139, 303, 503, 788, 789, 794 

definition 793 
POLLERR 794 
POLLHUP 794 
POLLIN 793 
POLLNVAL 794 
POLLOUT 793 
POLLPRI 794 

popen() 84, 86, 87, 90, 130, 504 

definition 86 
port 

reseau 47, 822 

serie 897 
POSITIVE_SIGN 733 
Posix VI 

Posix.lb 123, 177, 191, 367 

Posix. le 46 
POSIXLY_CORRECT 60 
PostgreSQL 587 
postorder 453, 456 
pow() 

definition 641 
powf() 

definition 641 
powl() 

definition 641 
PPID 29, 31,81 
PPP816 

pread() 303, 504,511,803 
preorder 453 

printfO 230, 238, 239, 264, 710, 
724, 725, 728 

definition 238 
PRIO_MAX 273 
PRIO_MIN 273 
PRIO_PGRP 273 
PRIO_PROCESS 273 
PRIOJJSER 273 
processus 27 

etats d'un ~ 265 

fils 29,31,43,44,51,96, 105, 
108, 127, 158, 197, 266, 286, 
379,513,738 

leader 42-44, 96, 128 

pere29, 31,43, 44, 51,93, 95, 
96, 105, 127, 158, 197, 266, 
286, 379,513,738 

terminaison d'un - 93 
PROT_EXEC 372, 382 
PROT_NONE 372, 382, 383 
PROT_READ 372, 382 



PROT_WRITE 372, 374, 382, 383 

protocole reseau 817 

pselect() 

definitions 793 
psignal() 

definition 134 
pthead_equal() 296 
PTHEAD_STACK_MIN 299 
pthread_atfork() 307, 308 

definition 307 
pthread_attr_destroy() 

definition 298 
pthread_attr_getdetachstate() 

definition 298 
pthread_attr_getinheritsched() 

definition 301 
pthread_attr_getschedparam() 

definition 300 
pthread_attr_getschedpolicy() 

definition 299 
pthread_attr_getscope() 

definition 300 
pthread_attr_getstackaddr() 

definition 299 
pthread_attr_getstacksize() 

definition 299 
pthread_attr_init() 

definition 297 
pthread_attr_setdetachstate() 

definition 298 
pthread_attr_setinheritsched() 

definition 301 
pthread_attr_setschedparam() 

definition 300 
pthread_attr_setschedpolicy() 

definition 299 
pthread_attr_setscope() 300 

definition 300 
pthread_attr_setstackaddr() 

definition 299 
pthread_attr_setstacksize() 

definition 299 
pthread_attr_t 297 
PTHREAD_CANCEL 292 
pthread_cancel() 

definition 301 
PTHREAD_CANCEL_ 
ASYNCHRONOUS 302, 303 
PTHREAD_CANCEL_ 
DEFERRED 302, 303 



PTHREAD_CANCEL_DISABLE 
301,303 

PTHREAD_CANCEL_ENABLE 
301,303 

PTHREAD_CANCELED 301 
pthread_cleanup_pop() 304, 305 

definition 304 
pthread_cleanup_push() 304, 305 

definition 303 
pthread_cond_bi'oadcast() 

definition 318 
pthread_cond_destroy() 

definition 314 
pthread_cond_init() 

definition 314 
PTHREAD_COND_ 
INITIALIZER 314 
pthread_cond_signal() 315, 316, 
318 

definition 315 
pthread_cond_t 314 
pthread_cond_timedwait() 302 

definition 318 
pthread_cond_wait() 302, 315, 
317, 318 

definition 315 
pthread_condattr_destroy() 

definition 318 
pthread_condattr_init() 

definition 318 
pthread_condattr_t 314 
pthread_create() 291, 292, 297 

definition 291 
PTHREAD_CREATE_ 
DETACHED 298 
PTHREAD_CREATE_ 
JOIN ABLE 298 
pthread_detach() 296 

definition 296 
pthread_equal() 

definition 291 
pthread_exit() 295, 301, 312 

definition 292 
PTHREAD_EXPLICIT_SCHED 
300 

pthread_getschedparam() 

definition 300 
pthread_getspecific() 

definition 324 
PTHREAD_INHERIT_SCHED 
300 



Index 



955 



pthreadjoinO 292, 295, 296, 302 

definition 292 
pthread_key_create() 

definition 324 
pthread_key_delete() 325 

definition 324 
pthread_key_t 324 
pthread_kill() 326 

definition 326 
pthread_mutex_destroy() 

definition 309 
PTHREAD_MUTEX_ 
ERRORCHECK 3 1 1 
pthread_mutex_init() 309 

definition 309 
PTHREAD_MUTEX_ 
INITIALIZER 309 
pthread_mutex_lock() 310, 315 

definition 310 
PTHREAD_MUTEX_NORMAL 
311 

PTHREAD_MUTEX_ 
RECURSIVE 311 
pthread_mutex_t 309 
pthread_mutex_trylock() 310 

definition 310 
pthread_mutex_unlock() 315 

definition 310 
pthread_mutexattr_destroy() 

definition 311 
pthread_mutexattr_gettype() 

definition 311 
pthread_mutexattr_init() 

definition 311 
pthread_mutexattr_settype() 

definition 311 
pthread_mutexattr_t 311 
pthread_once() 306, 307, 325 

definition 306 
PTHREAD_ONCE_INIT 306 
pthread_once_t 306 
PTHREAD_SCOPE_PROCESS 
300 

PTHREAD_SCOPE_SYSTEM 
300 

pthread_self() 

definition 296 
pthread_setcancelstate() 

definition 301 
pthread_setcanceltype() 302 



pthread_setschedparam() 299 

definition 300 
pthread_setspecific() 

definition 324 
pthread_sigmask() 

definition 326 
pthread_t291, 297 
pthread_testcancel() 302 

definition 302 
PThreads 289 
ptrdiff_t 236 
ptsname() 

definition 891 
ptsname_r() 

definition 891 
puissance 641 
putcO 243 

definition 242 
putchar() 

definition 242 
putenv() 56 

definition 56 
putpwent() 

definition 683 
puts() 

definition 243 
pututline() 

definition 700 
pututxline() 

definition 702 
putw() 

definition 477 
putwc() 

definition 628 
putwchar() 

definition 628 
pwrite() 303,511,803 

definition 505 

Q 

qecvt() 

definition 624 
qecvt_r() 

definition 624 
qfcvt() 

definition 624 
qfcvt_r() 

definition 624 
qgcvt() 625 

definition 624 



qsort() 407, 446, 448, 534 

definition 446 
Qt 25 

quicksort 446 
QUIT 881 

R 

R_OK 572 
racine 

carree 641 

cubique 641 
raise() 

definition 138 
rand() 426 

definition 655 
RAND_MAX 655 
rand_r() 

definition 656 
random() 

definition 656 
Rationnelles 

expressions 419 
rawmemchr() 

definition 409 
RCS 21 
re_comp() 

definition 426 
re_exec() 

definition 426 
read() 131, 139, 140, 303,502, 
503, 504, 507, 508, 513, 787, 857 

definition 502 
readdir() 532-534, 536, 557 

definition 532 
readdir_r() 534 

definition 533 
readlink() 580 

definition 580 
readv() 303, 504 

definition 503 
realloc() 340-343, 352, 359 

definition 340 
realpathO 540, 541 

definition 540 
recherche 437 

dichotomique 444, 463 

sequentielle 440, 463 
recv() 303, 845 

definition 858 
recvfromO 303, 845 

definition 857 
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recvmsgO 

definition 858 
REG_ESPACE 421 
REG_EXTENDED 420, 426 
REGJCASE 420 
REG_NEWLINE 420 
REG_NOMATCH 421 
REG_NOSUB 420, 421, 426 
REG_NOTBOL 422 
REG_NOTEOL 422 
regcomp() 421, 422, 425, 535 

definition 420 
regerror() 421, 426 

definition 421 
regex_t420, 421 

regexec() 421, 422, 425, 535, 553 

definition 421 
regfree() 

definition 422 
regmatch_t 421 
Regulieres 

expressions 

Voir Rationnelles 
remove() 549 

definition 548 
rename() 549, 694 

definition 548 
repertoire 47, 531 
REPRINT 881 
returnO 81, 96, 97, 266 
rewind() 478, 491 

definition 478 
rewinddir() 

definition 534 
rindex() 

definition 411 
rint() 

definition 646 
rintf() 

definition 646 
rintl() 

definition 646 
Ritchie 

Denis M. 15, 230, 395 
RLIMJNFINITY217 
rlim_t 222 
RLIMiT_CORE 218 
RLIMIT_CPU 218 
RLIMIT_DATA 218, 334 
RLIMIT_FSIZE 218, 509 
RLIMIT_MEMLOCK 218, 374 



RLIMIT_NOFILE 218, 223 
RLIMIT_NPROC 119, 218 
RLIMIT_RSS 218 
RLIMIT_STACK 218, 345 
rmdir() 543, 548, 549 

definition 543 
ROT- 13 427 
rpm 20 
RSA 431 
RSS 349 
RUN_LVL 698 
RUSAGE_CHILDREN 215 
RUSAGE_SELF215 

s 

SJFBLK 583 

SJFCHR 583 

SJFIFO 582 

SJFREG 582 

SJRGRP 495, 496 

SJROTH 495, 496 

SJRUSR 495 

SJRWXG 495 

SJRWXO 495 

SJRWXU 495, 496 

S_ISBLK() 569 

S_ISCHR() 569 

S_ISDIR() 569 

S_ISFIFO() 569 

SJSGID 495, 543 

S_ISLNK() 569, 579 

S_ISREG() 569 

S_ISSOCK() 569 

SJSUID 495 

S_ISVTX 495, 543 

SJWGRP 495, 496 

SJWOTH 495 

SJWUSR 495 

SJXGRP 495, 496 

SJXOTH 495, 496 

SJXUSR 495 

SA_INTERRUPT 152 

SA_NOCLDSTOP 152 

SA_NODEFER 153 

SA_ONESHOT 153 

SA_ONSTACK 153, 154 

SA_RESETHAND 153 

SA_RESTART 152, 172, 173, 193, 

197 

SA_SIGINFO 153, 181, 182 



sbrk() 334, 336, 337, 340, 351 

definition 334 
scandir() 534, 535 

definition 534 
scanf() 255, 264 

definition 255 
SCCS 22 

SCHED_FIFO 279, 284, 299 
sched_get_priority_max() 

definition 281 
sched_get_priority_min() 

definition 281 
sched_getparam() 

definition 282 
sched_getscheduler() 

definition 279 
SCHED_OTHER 279, 281, 283, 
299 

SCHED_RR 279, 284, 299 
sched_rr_get_interval() 

definition 282 
sched_setparam() 

definition 282 
sched_setscheduler() 287, 299 

definition 284 
sched_yield() 276, 277, 287 

definition 286 
seed48() 

definition 657 
seed48_r() 

definition 658 
SEEK_CUR 478, 511, 520 
SEEK_END 478, 511, 520 
SEEK_SET 478, 511,520 
seekdir() 

definition 534 
select() 132, 139, 196, 197, 303, 
503, 509, 662, 788-790, 794, 796, 
864 

definition 789 
sem_close 

definition 320 
sem_destroy() 

definition 319 
sem_getvalue() 

definition 320 
sem_init() 319 

definition 319 
sem_open 

definition 320 
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sem_post() 320 

definition 320 
sem_t319 
sem_trywait() 

definition 320 
SEMJJNDO 774 
SEM_VALUE_MAX 320 
sem_wait() 303, 320 

deinition 320 
semaphores 

Posix.lb319 

Systeme V 772 
semctl() 759 

definition 773, 775 
semget() 759 

definition 773 
semid_ds 759 

struct 776 
semop() 139, 759 

definition 773 
send() 303, 845 

definition 858 
sendmsg() 

definition 858 
sendto() 303, 845 

definition 857 
service reseau 822 
session 43, 128 
SETALL 776 
setbuf() 469 

definition 489 
setbufferO 

definition 489 
setdomainname() 

definition 686 
setegid() 

definition 37 
setenv() 56 

definition 56 
seteuid() 

definition 34 
setfsent() 

definition 691 
Set-GID 37, 40, 47, 81, 86, 249 
setgid() 

definition 37 
Set-GID). 40 
setgrent() 

definition 68 1 
setgroups() 682 

definition 39 



sethostentO 

definition 836 
sethostidO 

definition 686 
sethostnameO 686 

definition 685 
setitimerO 126, 199, 201, 662 

definition 199 
setjmpO 170, 172 
setkeyO 431 
setkey_r() 431 
setlinebuf() 

definition 489 
setlocale() 404, 405, 4 1 3 , 7 1 0, 7 1 2, 
722 

definition 721 
setmntent() 

definition 692 
setnetentO 

definition 837 
setpgid() 43 

definition 43 
setpgrpO 

definition 43 
setpriority() 275 

definition 273 
setprotoent() 

definition 819 
setpwent() 

definition 683 
setregid() 

definition 37 
setresgid() 

definition 40 
setresuid() 

definition 34, 36 
setreuidO 34, 35 

definition 34 
setrlimitO 133, 334 

definition 223 
setservent() 

definition 826 
setsid() 44, 868 

definition 44 
setsockoptQ 

definition 863 
setstate() 

definition 656 
settimeofdayO 663 

definition 663 



Set-UID 33-35, 46, 47, 77, 81, 85, 
86, 170, 249, 251 
setuidO 34, 35 

definition 34 
setusershellO 

definition 684 
setutentO 

definition 699 
setutxentO 

definition 702 
SETVAL 776 

setvbuf() 487, 489, 807, 853 

definition 487 
SHELL 59, 60 

shell 29, 31, 43, 51, 55, 59, 61, 76, 
77, 84-86, 93, 217, 228, 558, 684 

bash 55, 60, 77, 93, 158, 169, 
207, 214, 220, 221 

ksh55 

tcsh 55, 77,219, 221 
SHM_LOCK 771 
SHM_RDONLY 

definition 771 
SHM_RND 

definition 771 
SHM_UNLOCK 771 
shmat() 759, 771 

definition 770 
shmctlO 759, 771 

definition 770 
shmdtO 759 

definition 770 
shmgetO 759 

definition 770 
shmid_ds 759 
SHMMAX 770 
SHMMIN 770 
shutdown() 857 

definition 857 
SLASYNCIO 182 
SI_KERNEL 182 
SI_MESGQ 182 
SI_QUEUE 182, 186 
SI_SIGIO 182 
SI_TIMER 182, 186 
SI_USER 182, 186 
SID 43, 81 
sig_atomic_t 167 
SIG_BLOCK 162 
SIG_DFL 141, 143, 152 
SIG_ERR 141 
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SIGJGN 141, 152 
SIG_SETMASK 162 
SIGJJNBLOCK 162 
SIGABRT 97, 106, 108, 125, 126 
sigaction() 140, 141, 151, 197, 325 

definition 151 
sigaddset() 

definition 155 
SIGALRM 126, 139, 140, 170, 
172, 186, 199, 204 
sigaltstack() 154 

definition 154 
sigandset() 

definition 155 
sigblockQ 162 
SIGBUS 127 

SIGCHLD 86, 96, 108, 127, 139, 
266, 848 
SIGCLD 127 

SIGCONT 96, 128, 131, 137, 143, 

145, 152, 266 

sigdelset() 

definition 155 
sigemptyset() 

definition 155 
SIGEV_NONE 800 
SIGEV_SIGNAL 800 
SIGEV_THREAD 800 
sigfillset() 162 

definition 155 
SIGFPE 127, 170 
siggetmask() 162 
SIGHUP 96, 128, 179 
SIGILL 127-129, 170, 179 
SIGINFO 134 

SIGINT 86, 129, 156, 157, 158, 
163, 245 

siginterruptO 148, 149 

definition 147 
SIGIO 129, 130, 796 
SIGIOT 125 
sigisemptyset() 

definition 155 
sigismember() 

definition 155 
SIGKILL 130, 133, 138, 141-143, 
151, 152, 162, 190,218 
siglongjmpO 126, 170, 346 

definition 170 
SIGLOST 134 
sigmaskQ 162 



signal() 140, 159 

definition 141 
signaux44, 47,81,93,97, 123, 151 

bloques 138, 145, 158, 161, 
179, 186, 189 
sigorset() 

definition 155 
sigpause() 

definition 167 
sigpendingO 

definition 163 
SIGPIPE 130, 508, 745, 746, 750 
SIGPOLL 129 

sigprocmask() 161, 162, 165, 166, 
190 

definition 161 
SIGPROF 126 
SIGPWR 134 
sigqueueO 179, 181, 184 

definition 181 
SIGQUIT 86, 130, 156, 157, 158, 
160, 161 

SIGRTMAX 124, 133, 178, 179 
SIGRTMIN 124, 133, 178, 179 
SIGSEGV 127, 168, 170, 179, 238, 
249, 383, 385, 386, 396, 488 
sigset_t 152, 155 

definition 155 
sigsetjmp() 170 

definition 170 
sigsetmask() 162 
SIGSTKFLT 128 
SIGSTOP 130, 131, 138, 141, 142, 
143, 151, 266 

sigsuspend() 167, 173, 189, 201, 
303 

definition 166 
SIGTERM 130, 131, 137, 160, 168 
sigtimedwait() 189, 190, 303 

definition 189 
SIGTRAP 131 
SIGTSTP 131 
SIGTTIN 131, 503 
SIGTTOU 132 

SIGUSR1 108, 132, 133, 162, 165 
SIGUSR2 132, 133, 184 
sigval_t 800 
sigvec() 141 
SIGVTALRM 126 
sigwait() 303, 329 
definition 328 



sigwaitinfoO 189, 190, 191, 303 

definition 189 
SIGWINCH 133 
SIGXCPU 133, 218 
SIGXFSZ 133, 218, 508, 509, 511 
sin() 

definition 635 
sincos() 

definition 637 
sincosf() 

definition 637 
sincoslQ 

definition 637 
sinf() 

definition 635 
sinhQ 

definition 637 
sinhf() 

definition 637 
sinhl() 

definition 637 
sinl() 

definition 635 
size_t 236, 332 
sizeof() 

definition 613 
sleep() 126, 193, 195, 197, 199, 
303 

definition 193 
snprintf() 239 

definition 238 
SO_BROADCAST 863, 864 
SO_BSDCOMPAT 863, 864 
SO_DEBUG 863 
SO_DONTROUTE 863 
SO_ERROR 863 
SO_KEEPALIVE 863 
SO_LINGER 863 
SO_OOBINLINE 864 
SO_RCVBUF 864 
SO_RCVLOWAT 864 
SO_RCVTIMEO 864 
SO_REUSEADDR 864 
SO_SNDBUF 864 
SO_SNDLOWAT 864 
SO_SNDTIMEO 864 
SO_TYPE 864 
SOCK_DGRAM 840, 845 
SOCK_RAW 840 
SOCK_STREAM 840 
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socket 130, 132, 839 

raw 47 
socketO 493,515, 582 

definition 839 
socketpair() 

definition 842 
socklen_t 843 
SOL_SOCKET 863 
sous-option 67 
speed_t 900 

sprintf() 231,239,618,622 

definition 238 
sqrtQ 

definition 641 
sqrtf() 

definition 641 
sqrtl() 

definition 641 
srand() 

definition 655 
srand48() 

definition 657 
srand48_r() 

definition 658 
srandom() 

definition 656 
SS_DISABLE 154 
SS_ONSTACK 154 
sscanf() 261, 264, 618 

definition 255 
SSIZE_MAX 502 
ssize_t 236, 502, 504 
standard 

bibliotheque ~ 230 

entree ~ 86, 228, 229 

erreur ~ 90, 97, 228 

sortie ~ 86, 87, 228, 229, 243 
START 881 

stat() 375, 557, 569, 573, 748 

definition 567 
statfs() 696 

definition 695 
statistiques 

sur un processus 215 
stderr 62, 228, 230, 238, 473, 485, 
486,514,516 

definition 228 
STDERR_FILENO 493 
stdin 245, 249, 264, 473, 514, 516 

definition 228 
STDIN_FILENO 493, 569 



stdout 228, 230, 238, 242, 243, 
473,485,514,516 

definition 228 
STDOUT_FILENO 493, 569 
stime() 663 

definition 663 
STOP 881 
store() 590 

definition 590 
stpcpy() 398, 401 

definition 398 
stpncpy() 398, 401 

definition 398 
strace 13 

strcasecmpO 403, 404, 438, 725 

definition 403 
strcasestr() 413 

definition 412 
strcat() 

definition 400 
strchr() 410, 411 

definition 410 
strcmpO 401, 402, 406, 407, 437 

definition 401 
strcollO 405, 406, 725 

definition 405 
strcpyO 129, 395 

definition 395, 397 
strcspnQ 

definition 413 
strdupO 399 

definition 399 
strdupa() 

definition 399 
strerror() 117-119, 122, 231, 705 

definition 117 
strerror_r() 

definition 117 
strfmon() 724, 726, 728 

definition 725 
strfryO 

definition 426 
strftime() 669, 670, 672, 676, 725, 
728 

definition 667 
strip 14 

strlen() 253, 395, 396, 401, 534 

definition 395 
strncasecmpO 403 

definition 403 



strncatO 400, 401 

definition 400 
strncmpO 56, 402 

definition 402 
strncpy() 392 

definition 397 
strndupO 399 

definition 399 
strndupa() 

definition 399 
strnlen() 396, 409 

definition 396 
strpbrk() 415 

definition 413 
strptime() 670, 671, 673, 675 

definition 670 
strrchr() 411 

definition 410 
strsepO 

definition 416 
strsignalO 135 

definition 134 
strspn() 413, 414 

definition 413 
strstrO 411 

definition 411 
strtodO 264 

definition 620 
strtofO 

definition 620 
strtokO 414, 416 

definition 414 
strtok_r() 

definition 416 
strtolO 264, 619 

definition 619 
strtoldO 

definition 620 
strtollO 

definition 619 
strtoulO 264 

definition 619 
strtoull() 

definition 619 
struct aiocb 798, 804 
struct dirent 505, 532 
struct file 505,511,518 
struct file_operations 583 
struct files_struct 505 
struct flock 520, 522 
struct fstab 691 
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struct group 680 


definition 406 


TCIFLUSH 877 


struct hsearch_data 458 


stty 129, 245 


TCIOFF 877 


struct in_addr 828 


stuct siginfo 185 


TCIOFLUSH 877 


struct in6_addr 828 


SUSP 881 


TCION 877 


struct inode 505 


SUSv3 VI, 2 


Tcl/Tk 89 


struct iovec 503 


swprintf() 


TCOFLUSH 877 


struct ip_mreq 865 


definition 629 


TCOOFF 877 


struct ipc_perm 759 


swscanf() 


TCOON 877 


struct itimerval 200 


definition 629 


TCP 814, 846 


struct lconv 729, 733 


symlink() 582 


presentation 816 


struct linger 863 


definition 579 


TCP/IP 130, 132 


struct option 


sync() 470, 507 


TCP_MAXSEG 867 


definition 65 


definition 470 


TCP_NODELAY 867 


struct passwd 682 


sys_errlist[] 


TCSADRAIN 875 


struct pollfd 793 


definition 121 


TCSAFLUSH 875 
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